news 2026/7/2 2:17:16

RAG:让模型先查资料再回答(工作流程)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG:让模型先查资料再回答(工作流程)

本篇将对RAG的工作流程进行更详细的介绍。

离线索引:考前整理笔记

Step1:文档切块—把厚书拆成一页页笔记

将长文档切成相互独立又语义完整的短文本块。就像考试前,把厚厚的课本拆成一页页便签,每张便签只记一个知识点(为什么不直接带课本?因为太厚了,翻起来太慢,而且很多内容跟考试无关)

关键在于平衡切分粒度,块太大会引入噪声,块太小会丢失上下文,实际操作中会结合多种切块方法。

Step2:文本向量化—给每页笔记贴语义标签

切好块之后,每一段文本会被转换成一串数字——专业术语叫向量(Vector)或嵌入(Embedding)。这串数字可以理解成这段文本的"语义标签":意思相近的文本,标签也相近;意思不同的文本,标签离很远。

Step3:建立索引—按标签归档进资料夹

所有文本块及对应向量,都会存进一个向量数据库,并建立索引(目录),以供后续查询。就像把所有笔记按标签归档进资料夹,下次查找时能快速定位。

在线查询:开卷答题

Step4:问题向量化—划出题目关键词

用户的问题,也要用同样的方式转成向量,和Step2用的是同一个嵌入模型、同一套"标签系统"。

就像考试时先划出题目的关键词,才能拿着关键词去翻笔记,并且问题和笔记用的是同一套标签语言,才能对上号。

Step5:语义检索—翻笔记找相关的那几页

拿着问题的向量,去向量数据库里找语义最接近的文本块,最基础的是使用近似最近邻检索(ANN),核心思想是以牺牲少量精度为代价,换取检索速度的指数级提升。

检索后返回排名前K个最相似的文本块,需要权衡K值的大小,K值太小可能遗漏相关块,K太大会引入噪声且增加后续重排和模型上下文压力,这Top_K个文本块就是要给Ai看的"参考资料"。

就像拿到考题的关键点后翻笔记,找到和题目最相关的那几页。

Step6:回答生成—照着笔记写出答案

最后,把问题和检索到的资料拼在一起,组成一个完整的Prompt发给大模型,让Ai依据这些"参考资料"来回答,就像开卷考试时照着笔记写答案,比凭空编造靠谱多了。

RAG的进阶玩法

上面介绍的是最基础的RAG流程,实际应用中还有很多优化方向:

  1. 混合检索(Hybrid Search):不仅用语义向量检索,还结合传统的关键词检索,两者取长补短。语义检索擅长理解意思,关键词检索擅长精确匹配。

  1. 重排序(Reranking):在初始召回之后,使用一个更强大但计算开销更高的模型对所有候选文档进行一一评分和排序,把最相关的排到前面。

  1. 查询改写(Query Rewriting):用户的问题有时候表述不清晰,利用LLM对用户原始问题进行改写,例如补全省略、纠错与规范化、假设性改写等,使其更清晰完整。

  1. Self-RAG:自我反思的RAG,让模型自己决定什么时候需要检索、检索回来的内容有没有用、最终回答有没有问题。

  1. GraphRAG知识图谱增强检索:把资料之间的关系用"知识图谱"组织起来,用图的结构来理解和检索,而不是只靠向量相似度。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/2 2:14:50

LeetCode 23.合并K个升序链表

给你一个链表数组,每个链表都已经按升序排列。 请你将所有链表合并到一个升序链表中,返回合并后的链表。 示例 1: 输入:lists [[1,4,5],[1,3,4],[2,6]] 输出:[1,1,2,3,4,4,5,6] 解释:链表数组如下&#xf…

作者头像 李华
网站建设 2026/7/2 2:14:23

国产AI芯片与大模型适配优化实战解析

1. 项目背景与行业意义国产芯片与国产大模型的"双子星"组合正在重塑国内AI产业格局。清微智能作为国内领先的AI芯片企业,其Day 0适配能力直接决定了国产大模型在实际场景中的落地效率。这次与智谱GLM-5.1的深度适配,标志着从硬件到软件的完整国…

作者头像 李华
网站建设 2026/7/2 2:14:04

AD5593R与dsPIC30F4013在嵌入式信号处理中的黄金组合

1. 为什么选择AD5593R与dsPIC30F4013这对黄金搭档在嵌入式信号处理领域,ADC(模数转换器)和DAC(数模转换器)的组合应用无处不在。但真正把这对组合玩出"魔力"的工程师都知道,选型匹配度直接决定系…

作者头像 李华
网站建设 2026/7/2 2:13:10

2025了会议纪要还写得慢又漏任务?听脑帮你智能提取任务超省心!

上个月我们部门招应届生,一天面8个,从上午9点到下午5点,我和主管轮流面,结束后还要对着录音笔整理面试记录—你懂那种耳朵听麻、眼睛看花的感觉吧?有时候候选人说快了,或者带点家乡方言,回头转写…

作者头像 李华
网站建设 2026/7/2 2:12:55

让大模型跑在小芯片上:工程挑战比口号更硬

让大模型跑在小芯片上:工程挑战比口号更硬 一、小芯片跑大模型不是魔法 “让大模型跑在小芯片上”听起来很热血,但真正落地时很硬:内存不够、算子不支持、带宽不足、功耗过高、响应太慢、模型更新困难。宣传里一句端侧智能,工程里…

作者头像 李华
网站建设 2026/7/2 2:12:33

百度千帆对话系统实测:多模态能力与生态整合的深度拆解

百度千帆对话系统实测:多模态能力与生态整合的深度拆解昨天下午我拿百度千帆大模型平台(文心一言企业版)跑了一组对比测试,主要想看看在2026年这个节点,百度在“对话式AI”和“智能驾驶”双轮驱动下的技术底座&#xf…

作者头像 李华