news 2026/6/25 16:37:55

[智能体-315]:LangChain 实现 RAG(检索增强生成)的完整工作流,并且是基于 ChatGLM 大模型的实现方案。

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[智能体-315]:LangChain 实现 RAG(检索增强生成)的完整工作流,并且是基于 ChatGLM 大模型的实现方案。

这张图是LangChain 实现 RAG(检索增强生成)的完整工作流,并且是基于 ChatGLM 大模型的实现方案。下面按「离线知识库构建」「在线问答推理」两大阶段,拆解每一步的作用与原理。


一、整体流程概览

整个流程分为两大阶段:

  1. 离线阶段:知识库构建(步骤 1-7)
  2. 在线阶段:问答与生成(步骤 8-15)

二、阶段 1:离线知识库构建(数据准备)

目标:把本地文档变成可被检索的向量知识库。

表格

步骤环节核心作用通俗解释
1Local Documents → Unstructured Loader加载本地非结构化文档(PDF/Word/Markdown 等),解析成纯文本把文件 “读进来”,提取文字内容
2Unstructured Loader → Text输出统一格式的纯文本解决不同文件格式的解析问题
3Text → Text Splitter按固定大小 / 语义边界,将长文本切割成短片段(Chunks)解决大模型上下文窗口限制,让文本适合后续处理
4Text Splitter → Text Chunks输出标准化文本片段每个片段都是后续向量化和检索的最小单元
5Text Chunks → Embedding使用嵌入模型,将文本片段转换为高维向量把文字变成机器能计算的数字
6Embedding → VectorStore将文本片段、向量和元数据存入向量数据库建立可快速检索的知识库
7VectorStore向量数据库就绪,支持相似度检索为后续问答提供数据支持

三、阶段 2:在线问答推理(用户提问→生成答案)

目标:基于用户问题,从知识库召回相关信息,辅助大模型生成答案。

表格

步骤环节核心作用通俗解释
8Query → Embedding将用户提问文本向量化把用户问题也变成向量,方便在知识库中匹配
9Embedding → Query Vector输出问题向量为相似度检索做准备
10Query Vector → Vector Similarity在向量数据库中计算问题向量与库中向量的相似度找出和问题语义最相关的文本片段
11Vector Similarity → Related Text Chunks召回 Top-K 个相关文本片段从知识库中取出能回答问题的参考材料
12Related Text Chunks → Prompt Template将召回的文本片段填入预设的提示词模板把参考资料和用户问题整合成大模型能理解的指令
13Prompt Template → Prompt输出完整的提示词(包含用户问题 + 参考上下文)形成给大模型的最终输入
14Prompt → LLM(ChatGLM)调用 ChatGLM 大模型,基于提示词生成回答让大模型结合参考资料回答问题
15LLM → Answer输出最终答案呈现给用户的结果

四、关键模块解析

1. Text Splitter(文本分割)

  • 核心目的:解决长文本超出大模型上下文窗口的问题,同时保证分割后的片段语义完整。
  • 常见策略:按字符数分割、按句子分割、按语义分割(如 LangChain 的RecursiveCharacterTextSplitter)。

2. Embedding(向量化)

  • 核心目的:实现自然语言的数值化,让机器可以通过向量空间的距离来判断文本语义的相似度。
  • 常见模型:OpenAI Embeddings、BGE、Sentence-BERT,国内场景也可使用与 ChatGLM 配套的嵌入模型。

3. VectorStore(向量数据库)

  • 核心目的:高效存储和检索向量,支持亿级数据下的毫秒级召回。
  • 常见工具:Chroma、Milvus、FAISS、Pinecone,LangChain 对这些数据库都提供了统一的接口。

4. Prompt Template(提示词模板)

  • 核心目的:规范大模型的输入格式,引导模型基于召回的上下文生成答案,减少模型幻觉。
  • 典型模板:“根据以下上下文回答问题:{context}。问题:{query}。回答:”

五、与 ChatGLM 的适配

这张图是基于LangChain + ChatGLM的组合方案:

  • LangChain 提供了统一的工作流编排能力,负责数据加载、分块、向量化、检索和提示词构建;
  • ChatGLM 作为后端大模型,负责理解提示词并生成答案;
  • 这种架构的优势是:可以灵活替换嵌入模型、向量数据库和大模型,适配不同的业务场景和部署环境。

六、核心价值总结

这个流程解决了大模型的两个关键问题:

  1. 知识过时:通过向量数据库接入最新的私有数据,让模型能回答超出其训练数据范围的问题;
  2. 模型幻觉:通过召回相关上下文并引导模型基于事实生成答案,大幅降低模型编造信息的概率。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/14 7:44:23

数据恢复神器PhotoRec:从误删到格式化的全方位拯救指南

数据恢复神器PhotoRec:从误删到格式化的全方位拯救指南 【免费下载链接】testdisk TestDisk & PhotoRec 项目地址: https://gitcode.com/gh_mirrors/te/testdisk 数据恢复是每个数字时代用户都可能面临的挑战,而PhotoRec作为开源界的恢复神器…

作者头像 李华
网站建设 2026/6/14 7:46:43

IAR for MSP430 5.3开发环境搭建与激活全流程详解

1. 项目概述:从“拿来主义”到亲手搞定IAR开发环境搞嵌入式开发,尤其是玩MSP430这类低功耗MCU的,IAR Embedded Workbench几乎是绕不开的“瑞士军刀”。我以前也和很多新手一样,习惯当“伸手党”,安装包、破解文件都是从…

作者头像 李华
网站建设 2026/6/14 7:25:24

仿真环境搭建:Isaac Sim vs MuJoCo vs PyBullet选型指南

文章目录 每日一句正能量 一、为什么仿真器选型是具身智能的"第一性决策"? 二、三大仿真器的底层架构解剖 2.1 物理引擎:三种世界观 2.2 渲染架构:视觉策略的"训练场" 三、深度对比:八个维度 3.1 物理精度 3.2 并行训练能力 3.3 渲染与视觉策略训练 四…

作者头像 李华
网站建设 2026/6/13 14:46:38

终极图片去重解决方案:3步让10000张照片秒变有序的完整指南

终极图片去重解决方案:3步让10000张照片秒变有序的完整指南 【免费下载链接】AntiDupl A program to search similar and defect pictures on the disk 项目地址: https://gitcode.com/gh_mirrors/an/AntiDupl 在数字时代,无论是摄影爱好者还是专…

作者头像 李华
网站建设 2026/6/15 17:06:02

WiFi信号满格却网速慢?工程师详解信号、速率与干扰的真相

1. 从“满格信号”到“龟速下载”:一个无线工程师的深度观察作为一个在无线通信领域摸爬滚打了十几年的工程师,我每天打交道最多的就是各种信号和速率。这些年,我见过太多用户举着手机,看着满格的WiFi信号图标,却对着半…

作者头像 李华