RAG：让模型先查资料再回答（工作流程）-洪萨配资

本篇将对RAG的工作流程进行更详细的介绍。

离线索引：考前整理笔记

Step1：文档切块—把厚书拆成一页页笔记

将长文档切成相互独立又语义完整的短文本块。就像考试前，把厚厚的课本拆成一页页便签，每张便签只记一个知识点（为什么不直接带课本？因为太厚了，翻起来太慢，而且很多内容跟考试无关）

关键在于平衡切分粒度，块太大会引入噪声，块太小会丢失上下文，实际操作中会结合多种切块方法。

Step2：文本向量化—给每页笔记贴语义标签

切好块之后，每一段文本会被转换成一串数字——专业术语叫向量（Vector）或嵌入（Embedding）。这串数字可以理解成这段文本的"语义标签"：意思相近的文本，标签也相近；意思不同的文本，标签离很远。

Step3：建立索引—按标签归档进资料夹

所有文本块及对应向量，都会存进一个向量数据库，并建立索引（目录），以供后续查询。就像把所有笔记按标签归档进资料夹，下次查找时能快速定位。

在线查询：开卷答题

Step4：问题向量化—划出题目关键词

用户的问题，也要用同样的方式转成向量，和Step2用的是同一个嵌入模型、同一套"标签系统"。

就像考试时先划出题目的关键词，才能拿着关键词去翻笔记，并且问题和笔记用的是同一套标签语言，才能对上号。

Step5：语义检索—翻笔记找相关的那几页

拿着问题的向量，去向量数据库里找语义最接近的文本块，最基础的是使用近似最近邻检索（ANN），核心思想是以牺牲少量精度为代价，换取检索速度的指数级提升。

检索后返回排名前K个最相似的文本块，需要权衡K值的大小，K值太小可能遗漏相关块，K太大会引入噪声且增加后续重排和模型上下文压力，这Top_K个文本块就是要给Ai看的"参考资料"。

就像拿到考题的关键点后翻笔记，找到和题目最相关的那几页。

Step6：回答生成—照着笔记写出答案

最后，把问题和检索到的资料拼在一起，组成一个完整的Prompt发给大模型，让Ai依据这些"参考资料"来回答，就像开卷考试时照着笔记写答案，比凭空编造靠谱多了。

RAG的进阶玩法

上面介绍的是最基础的RAG流程，实际应用中还有很多优化方向：

混合检索（Hybrid Search）：不仅用语义向量检索，还结合传统的关键词检索，两者取长补短。语义检索擅长理解意思，关键词检索擅长精确匹配。

重排序（Reranking）：在初始召回之后，使用一个更强大但计算开销更高的模型对所有候选文档进行一一评分和排序，把最相关的排到前面。

查询改写（Query Rewriting）：用户的问题有时候表述不清晰，利用LLM对用户原始问题进行改写，例如补全省略、纠错与规范化、假设性改写等，使其更清晰完整。

Self-RAG：自我反思的RAG，让模型自己决定什么时候需要检索、检索回来的内容有没有用、最终回答有没有问题。

GraphRAG知识图谱增强检索：把资料之间的关系用"知识图谱"组织起来，用图的结构来理解和检索，而不是只靠向量相似度。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

LeetCode 23.合并K个升序链表

RAG：让模型先查资料再回答（工作流程）

离线索引：考前整理笔记

Step1：文档切块—把厚书拆成一页页笔记

Step2：文本向量化—给每页笔记贴语义标签

Step3：建立索引—按标签归档进资料夹

在线查询：开卷答题

Step4：问题向量化—划出题目关键词

Step5：语义检索—翻笔记找相关的那几页

Step6：回答生成—照着笔记写出答案

RAG的进阶玩法

学AI大模型的正确顺序，千万不要搞错了

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

国产AI芯片与大模型适配优化实战解析

AD5593R与dsPIC30F4013在嵌入式信号处理中的黄金组合

2025了会议纪要还写得慢又漏任务？听脑帮你智能提取任务超省心！

让大模型跑在小芯片上：工程挑战比口号更硬

百度千帆对话系统实测：多模态能力与生态整合的深度拆解

离线索引：考前整理笔记

Step1：文档切块—把厚书拆成一页页笔记

Step2：文本向量化—给每页笔记贴语义标签

Step3：建立索引—按标签归档进资料夹

在线查询：开卷答题

Step4：问题向量化—划出题目关键词

Step5：语义检索—翻笔记找相关的那几页

Step6：回答生成—照着笔记写出答案

RAG的进阶玩法

学AI大模型的正确顺序，千万不要搞错了

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

LeetCode 23.合并K个升序链表

国产AI芯片与大模型适配优化实战解析

AD5593R与dsPIC30F4013在嵌入式信号处理中的黄金组合

2025了会议纪要还写得慢又漏任务？听脑帮你智能提取任务超省心！

让大模型跑在小芯片上：工程挑战比口号更硬

百度千帆对话系统实测：多模态能力与生态整合的深度拆解

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】