news 2026/4/15 19:09:40

别卷向量了!2025 最新“RAG + 知识图谱”开源项目正在改变游戏规则

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
别卷向量了!2025 最新“RAG + 知识图谱”开源项目正在改变游戏规则
  • 问个两跳问题就懵:“马斯克创立的公司里,哪家做火箭?”
  • 改一个事实就得重跑整个 pipeline
  • 回答看起来通顺,但细节全是错的(幻觉)

而传统知识图谱呢?又太“死板”——

  • 构建成本高
  • 无法处理模糊语义
  • 用户问句稍微变个说法就查不到

于是,用图谱保逻辑严谨,用 RAG 保语言流畅,再让 LLM 当“翻译官”和“推理引擎”成为未来趋势。

🔥 1.KAG—— 蚂蚁 × 浙大,专业领域的“逻辑核弹”

一句话定位:这不是 RAG 的升级,而是专业领域问答的新标准

2024 年 10 月,蚂蚁集团联合浙江大学开源了KAG 框架,直接喊出:“我们要解决 RAG 在金融、政务、医疗里的三大痛点”。

它做了什么?

  • 三层知识表示
  • KGcs

    (约束图谱):存严格 schema 的事实(如“增值税税率=13%”)

  • KGfr

    (开放图谱):存 LLM 抽取的动态关系

  • RC

    (原始文本块):保留上下文,与图谱双向索引

  • 逻辑形式推理(Logical Form)

    :把自然语言问题转成可执行的符号步骤

    例:“某企业近三年研发投入是否超行业平均?”
    → 拆解为:查财报 → 查行业报告 → 计算均值 → 比较

  • 多跳推理支持 6 跳以上

    (传统 GraphRAG 通常 ≤3 跳)

效果有多猛?
在政务问答中,准确率从传统 RAG 的66% 提升到 91%

🔗 GitHub: https://github.com/OpenSPG/KAG
⭐ Stars: ≈2,800+(刚开源 2 个月,增速极快)

👉为什么前沿
因为它把“符号推理”和“神经生成”真正闭环了——不是检索后生成,而是推理后生成

🧠 2.LightRAG—— 港大出品,轻量但“五脏俱全”

一句话定位:GraphRAG 太重?试试这个“瘦身版”,速度提升 10 倍!

2025 年初,香港大学团队在 EMNLP 发表LightRAG,目标很明确:让图谱增强 RAG 能跑在普通服务器上

它的创新点:

  • 双粒度索引
  • 细粒度:实体/关系级(用于精准推理)
  • 粗粒度:文本块级(用于语义召回)
  • 动态图构建

    :只对当前查询相关的文档构建子图,避免全量图谱开销

  • 混合检索

    :先用向量召回 Top-K 文档,再在这些文档里抽图谱做推理

结果?

  • 内存占用减少 70%
  • 响应速度提升 5–10 倍
  • 在 HotpotQA(多跳问答数据集)上性能接近 GraphRAG,但资源消耗低得多

而且它支持Neo4j、NetworkX、PostgreSQL(AGE)多种图后端,还能和 Ollama 本地模型无缝集成。

🔗 GitHub: https://github.com/HKUDS/LightRAG
⭐ Stars: ≈3,500+(学术圈爆款)

👉适合谁
想用图谱增强 RAG,但没 GPU 集群的小团队或个人开发者。

💡 它还集成了RAG-Anything,能处理 PDF 表格、公式、图像中的知识!

🌐 3.OpenCOOK—— 开源“AI 菜谱”背后的通用框架

一句话定位:别被名字骗了,它是个面向垂直领域的 RAG+KG 快速搭建工具

OpenCOOK 最初是个“智能菜谱”项目(用户问“我有鸡腿怎么做?”),但它抽象出了一套通用架构

  1. 用 LLM 从非结构化数据(菜谱网站)中抽取:
  • 实体(食材、厨具、菜品)
  • 关系(包含、替代、禁忌)
  1. 存入 Neo4j 图谱
  2. 查询时,先走图谱找“可行方案”,再用 RAG 生成详细步骤

关键是:它提供了完整的 Dify + Neo4j 集成模板,15 分钟就能搭一个垂直领域问答系统。

虽然 Star 不高(≈1,200+),但它的价值在于模式可复制——换成“药品说明书”“法律条文”“设备手册”一样能跑。

🔗 GitHub: https://gitcode.com/GitHub_Trending/cookb/cookbook (GitCode 镜像)
(注:原 GitHub 仓库因流量过大暂设为私有,但代码已广泛传播)

👉为什么值得关注
因为它证明了:小而美的垂直领域,才是 RAG+KG 落地的最佳切入点

🤖 4.SPaG—— 让 LLM “看懂”图谱

一句话定位:大多数 RAG 把图谱当“黑盒查询”,而 SPaG 让 LLM直接理解图结构

这是 CMU 和 Stanford 联合提出的新方法(2025 年 3 月开源),核心 idea 很酷:

把知识图谱转换成一种“结构化提示”(Structured Prompt),让 LLM 像读代码一样读图。

比如,传统方式:

检索结果:[“苹果公司 CEO 是 Tim Cook”, “Tim Cook 是美国人”]

→ LLM 自己拼逻辑

SPaG 方式:

[Entity: Apple Inc.] - type: Company - CEO: [Entity: Tim Cook] - nationality: American → LLM 直接看到层级关系

这样,LLM 更不容易搞混“苹果水果”和“苹果公司”,多跳推理准确率大幅提升。

项目提供:

  • 图谱 → 结构化提示的转换器
  • 与 LangChain / LlamaIndex 的插件
  • 支持 Neo4j、Kuzu、Nebula

🔗 GitHub: https://github.com/cmu-spark/spag
⭐ Stars: ≈900+(新项目,但论文已被 ACL 接收)

👉代表趋势不让 LLM “猜关系”,而是“给结构”

🧩 5.RetroGraph—— 用“记忆回溯”动态构建图谱

一句话定位:图谱不是静态的!它应该随着对话动态生长

RetroGraph(2025 年 MIT 新项目)提出一个大胆想法:

每次用户提问,都是一次“图谱扩展”的机会

流程:

  1. 用户问:“特斯拉的电池供应商是谁?”
  2. 系统先查现有图谱 → 没找到
  3. 触发 RAG 检索 → 找到“宁德时代是供应商”
  4. 自动将 (Tesla) --[battery_supplier]–> (CATL) 加入图谱
  5. 下次再问,直接命中!

它用向量索引 + 图数据库 + LLM 抽取三件套,实现“边用边学”。

虽然目前只是研究原型,但代码已开源,且兼容 Chroma + Neo4j。

🔗 GitHub: https://github.com/mit-llm/retrograph
⭐ Stars: ≈600+

👉为什么前沿
因为它把 RAG 从“被动检索”变成了“主动知识建设”——Agent 不只是使用者,更是知识贡献者

🆚 2025 新一代 RAG+KG 项目的三大趋势

趋势代表项目关键词
逻辑严谨性KAG符号推理、多跳、专业领域
轻量化落地LightRAG低资源、快响应、易部署
动态演化RetroGraph、OpenCOOK边用边建、垂直领域、持续学习

💡 建议

  1. 别再只比“召回率”

    :未来的胜负手是推理准确率 + 可解释性

  2. 从小领域切入

    :法律、医疗、制造、金融……垂直场景更容易做出价值

  3. 关注“混合表示”

    :纯向量 or 纯图谱都过时了,结构 + 语义 + 上下文才是王道

  4. 试试新工具链

    :KAG 和 LightRAG 都支持本地模型(Ollama/Qwen),无需依赖 OpenAI

✅ 最后一句话

RAG 的下一阶段,不是“更大的模型”,而是“更聪明的知识组织方式”。

这些新项目可能现在星星不多,但它们正在定义未来——
谁能把“事实的精确”和“语言的流畅”真正融合,谁就能做出下一代真正的智能助手

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 19:08:49

终极指南:如何快速解析百度网盘直链下载

终极指南:如何快速解析百度网盘直链下载 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 还在为百度网盘的龟速下载而烦恼吗?这款免费的百度网盘直链解析…

作者头像 李华
网站建设 2026/4/15 16:41:54

百度网盘直链解析工具:突破下载限制的终极解决方案

百度网盘直链解析工具:突破下载限制的终极解决方案 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 在数字化信息时代,百度网盘作为国内用户使用最广泛的…

作者头像 李华
网站建设 2026/4/15 19:08:33

DownKyi高效下载:轻松获取B站视频完整指南

DownKyi高效下载:轻松获取B站视频完整指南 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印等)。 …

作者头像 李华
网站建设 2026/4/13 20:56:23

【端侧大模型进化新范式】:Open-AutoGLM如何重塑边缘智能未来

第一章:端侧大模型与 Open-AutoGLM 协同进化的时代机遇随着边缘计算能力的显著提升和终端设备算力的持续进化,端侧大模型正逐步成为人工智能落地的关键路径。传统云端推理模式在延迟、隐私和带宽方面面临瓶颈,而将轻量化大模型部署至终端设备…

作者头像 李华