news 2026/1/28 8:36:30

RAG简介

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG简介
  1. 概述
    RAG(Retrieval Augmented Generation)检索增强生成技术,解决了LLM(Large Language Model)的知识局限性、in-context learning(上下文学习)的token限制、重新进行模型微调成本高以及数据安全考虑等痛点,以已有知识库作为背景知识,让AI模型从基于记忆和理解进行答案编造考试,转换成基于垂直领域知识库的开卷考试。
  2. 架构
    分为在线和离线两部分。
    • 离线
      离线部分主要是实现知识库的向量化存储和索引构建。大致包含了文档解析、拆分、入库以及构建索引等步骤。
    • 在线
      在线部分主要是实现Query的意图识别和结果生成。大致包含了Query的解析、基于相似度的查询匹配、构造prompt以及通过LLM输出结果等步骤。
  1. 为什么用向量数据库
    一方面查询场景不能简单通过文本的精确匹配来得到结果,而是通过语义匹配来得到结果。向量Embedding能充分包含语义信息;
    另一方面向量数据库在向量的存储和查询上有特有的优势。
  2. 文档解析拆分
    文档解析拆分包含了数据清洗、文本/图片/表格的识别、数据分段等过程。目前已有对应的机器学习和深度学习模型,如RagFlow。
  3. Query解析
    由于用户提问往往具有模糊性和复杂性,需要对问题进行改写、增强、分解
  4. 查询路由
    理解用户query后,在查询路由步骤,通过定义查询路由器以及各个查询数据插件,将用户查询情况传给LLM,通过LLM决策,决定接下来要调用哪个查询插件,然后调用执行路由选择的插件,最后将各个插件预定义格式返回的结果汇总
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/26 6:03:29

20亿参数撬动物理世界交互:Isaac-0.1开启轻量化多模态AI新纪元

导语:Meta前Chameleon团队打造的20亿参数多模态模型Isaac-0.1,以"小而精"的技术路径重新定义物理世界智能交互标准,为边缘设备AI部署提供新范式。 【免费下载链接】Isaac-0.1 项目地址: https://ai.gitcode.com/hf_mirrors/Perc…

作者头像 李华
网站建设 2025/12/23 17:51:39

AlDente电池管理神器:新手也能轻松掌握的MacBook电池保养秘诀

AlDente电池管理神器:新手也能轻松掌握的MacBook电池保养秘诀 【免费下载链接】AlDente-Charge-Limiter macOS menubar tool to set Charge Limits and prolong battery lifespan 项目地址: https://gitcode.com/gh_mirrors/al/AlDente-Charge-Limiter 对于M…

作者头像 李华
网站建设 2026/1/22 1:03:50

Gotify实时消息推送系统:5分钟快速搭建完整指南

Gotify实时消息推送系统:5分钟快速搭建完整指南 【免费下载链接】server A simple server for sending and receiving messages in real-time per WebSocket. (Includes a sleek web-ui) 项目地址: https://gitcode.com/gh_mirrors/serv/server Gotify是一个…

作者头像 李华
网站建设 2026/1/24 23:11:26

React组件渲染性能优化:打造丝滑用户体验的终极指南

React组件渲染性能优化:打造丝滑用户体验的终极指南 【免费下载链接】area51 项目地址: https://gitcode.com/GitHub_Trending/ar/area51 在现代Web应用开发中,React凭借其声明式编程模型和高效的虚拟DOM机制,已经成为构建用户界面的…

作者头像 李华
网站建设 2026/1/2 16:44:06

如何快速制作AI视频:WanVideo多模态生成的完整指南

如何快速制作AI视频:WanVideo多模态生成的完整指南 【免费下载链接】WanVideo_comfy 项目地址: https://ai.gitcode.com/hf_mirrors/Kijai/WanVideo_comfy 在AI视频制作领域,WanVideo项目通过创新的多模态视频生成技术,让文本转视频创…

作者头像 李华