《AI Agent智能体开发实践》1~6章试读_《ai agent 智能体开发实践》在线阅读-CSDN博客
AI Agent智能体开发实践【行情 报价 价格 评测】-京东
什么是RAG技术?RAG是一种将信息检索与文本生成相结合的AI技术。它通常包括以下两个核心步骤。
- 检索(Retrieval):根据输入问题或提示,从大型知识库或文档集合中检索相关文档片段。
- 生成(Generation):将检索到的相关内容与原始输入结合,生成更准确、信息更丰富的回答。
5.1.1 RAG技术概述
1. 技术本质
传统生成模型:仅依赖参数化知识(训练数据固化在模型权重中)。
RAG:将非参数化知识(实时检索的外部数据)与参数化知识(大模型生成能力)动态融合,形成“开卷考试”模式。
2. 工作流程(分为3步)
1)检索(Retrieval)
用户提问→向量化(Embedding模型)→从知识库(如向量数据库)中检索Top-K相关文档片段。
示例:问“2024年奥运会举办地”,检索到包含“巴黎”的文档。
2)增强(Augmentation)
将检索到的文档与原始问题合并,作为上下文输入大模型。
3)生成(Generation)
大模型基于上下文生成答案,并标注引用来源(如“根据维基百科2023年更新……”)。
3. 核心组件
(1)向量数据库(如FAISS、Pinecone):存储文档的向量化表示,支持快速相似性搜索。
(2)嵌入模型(如BGE、E5):将文本转为向量,需与生成模型适配,如中文场景用中文 Embedding。
(3)生成模型(如GPT-4、Llama3):负责整合检索内容与自身知识,生成连贯回答。
4. 典型应用场景
(1)企业知识库:内部文档问答(如“公司2025年差旅政策”)。
(2)实时信息:新闻摘要(结合最新网页检索)。
(3)长文本处理:法律合同分析(检索相关条款并生成解释)。
RAG技术正在成为增强大语言模型事实性和时效性的重要方法,在专业领域应用中展现出巨大 潜力。
5.1.2 RAG架构组成
RAG是一种结合了信息检索与生成式AI的架构,旨在让生成模型基于外部知识库的精准信息生成更可靠、更具体的回答。其核心组成包括知识库(Knowledge Base)、检索模块(Retriever)和生成模块(Generator),三者协同工作以提升输出内容的准确性和实用性。
1. 知识库
知识库是RAG架构的“信息源泉”,存储着供检索模块查询的结构化或非结构化数据,为生成模块提供事实依据。
(1)数据类型:
① 非结构化数据:文档(PDF、Word)、网页、对话记录、邮件、论文等。
② 结构化数据:数据库表、Excel表格、JSON文件等。
③ 半结构化数据:XML、Markdown、带标签的文本等。
(2)核心作用:提供领域内的专业知识、最新信息或特定事实,避免生成模型仅依赖训练数据导致的“幻觉”(虚构信息)。
(3)构建与维护:需经过数据清洗(去重、纠错)、格式统一、定期更新,确保信息的准确性和时效性。例如,企业知识库可能包含产品手册、客户案例,医疗知识库可能包含最新诊疗指南。
2. 检索模块
检索模块是连接用户查询与知识库的“桥梁”,负责从知识库中快速定位与查询相关的信息片段。
(1)核心任务:根据用户输入的查询(Query),从知识库中检索出最相关的文档或段落(通常称为“上下文(Context)”)。
(2)常用技术:
① 向量检索:将文本(查询和知识库内容)转换为高维向量(通过Embedding模型,如BERT、Sentence-BERT),再通过计算向量相似度(如余弦相似度)找到匹配项,适合非结构化数据。
② 关键词检索:基于关键词匹配(如Elasticsearch),适合结构化或对精度要求不高的场景。
③ 混合检索:结合向量检索和关键词检索,平衡召回率(找到所有相关信息)和精确率(排除无关信息)。
(3)关键指标:检索的相关性(是否准确匹配查询需求)和效率(响应速度)。例如,用户问“2024年诺贝尔物理学奖得主”,检索模块需从知识库中找到对应的新闻或官方公告段落。
3. 生成模块
生成模块是RAG的“输出端”,基于检索模块提供的上下文和用户查询,生成自然语言回答。
(1)核心任务:将检索到的相关信息整合成符合人类语言习惯的回答,同时确保内容基于上下文,避免编造信息。
(2)依赖模型:通常采用大语言模型(LLM),如GPT系列、LLaMA、Claude等,这些模型具备理解上下文和生成连贯文本的能力。
(3)工作逻辑:
① 接收用户查询和检索到的上下文。
② 理解查询意图,并结合上下文提取关键信息。
③ 按照逻辑顺序组织语言,生成回答(可要求标注信息来源,增强可信度)。
(4)示例:若检索到“2024年诺贝尔物理学奖授予研究量子纠缠的团队”,生成模块会将其转换为流畅的回答:“2024年诺贝尔物理学奖被授予在量子纠缠研究领域作出突破性贡献的团队,他们的成果推动了量子计算和通信技术的发展。”
5.1.3 RAG工作流程
RAG是一种结合信息检索与文本生成的技术,通过动态引入外部知识增强生成结果的相关性和准确性。其核心流程分为以下三个阶段。
1. 查询理解与检索
(1)查询解析:对用户输入进行语义分析,识别意图、实体和关键信息。
(2)知识检索:从数据库、文档集或网络等外部知识源中检索与查询相关的片段(如段落、图表描述等),通常借助向量相似度(如Embedding模型)或关键词匹配。
2. 上下文增强生成
(1)信息融合:将检索到的相关上下文与用户查询相结合,作为生成模型的输入(如GPT等LLM)。
(2)生成优化:模型基于检索内容生成回答,避免单纯依赖内部知识,提升事实性和时效性。
3. 反馈与优化机制
(1)结果评估:通过用户反馈、自动化指标(如引用准确性)或人工审核评估生成质量。
(2)迭代改进:优化检索策略(如调整检索范围)、更新知识库或微调生成模型,形成闭环。
优势:解决传统生成模型的幻觉问题,支持动态知识更新,适用于问答、客服等需高准确性的 场景。