news 2026/4/22 23:07:01

RAG项目做不好?可能是忽略了关键的一环

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG项目做不好?可能是忽略了关键的一环

一、从一个问题说起

你有没有遇到过这种情况:RAG系统明明召回了10条文档,但真正能回答用户问题的,可能只有寥寥几条?

这不是个例。很多人在做RAG项目时,把大量精力放在向量检索调参上,却忽略了中间最关键的一环——Rerank(重排序)

今天这篇文章,我们用大白话把RAG中的Rerank讲清楚,并深入解析背后的Bi-Encoder与Cross-Encoder核心区别。

二、向量检索为什么会召回"答非所问"的内容?

什么是向量检索?

简单理解:把问题和文档都变成一串"数字"(向量),然后找"距离最近"的文档。

**真实场景举例:**在保险知识库里搜索"感冒发烧要吃什么药?",可能召回这些内容:

“感冒期间应多休息,多喝水” ❌

“发热是人体的一种防御反应” ❌

“感冒分为普通感冒和流行性感冒” ❌

“体温超过38.5℃可服用对乙酰氨基酚或布洛芬” ✅

前三条都含有感冒发热的词,语义上看起来很相关,但都不是用户真正需要的答案。

这就是向量检索的局限:

它只认"长得像",不认"能不能用"。

三、Bi-Encoder 和 Cross-Encoder 的核心区别

Bi-Encoder(向量检索)——像两个人分别给自己的目标"拍照":一个人给问题拍照,另一个人给文档拍照

特点:问题和文档分开处理,两人各自得到一张"特征照片",然后比较两张照片的相似度。

图:Bi-Encoder — 两人各自得到一张"特征照片",比较两张照片的相似度判断"像不像"

Cross-Encoder(重排序)——像一个正常人同时看着问题和文档:

特点:问题和文档一起处理,能深度理解两者的关系。

图:Cross-Encoder — 同时看问题和文档,深度理解"能不能用"

一句话总结区别:

Bi-Encoder看文档和问题"像不像",Cross-Encoder看文档问题"能不能用"。

四、为什么"看起来像"但"不能用"?

你有没有想过:为什么向量检索会召回那些答非所问的文档?

答案就在于Bi-Encoder的工作方式。它把问题变成一个数字向量,把文档变成另一个数字向量,然后比较两个向量的**“距离”**。

它只能捕捉到**“话题相似性”**——比如都提到了"等待期"这个词。

但Cross-Encoder不一样。它把问题和文档拼在一起,一起进模型分析。

它能判断"答案相关性",而不只是话题相似性。

图:考试/点菜/相亲三个场景 — Bi-Encoder看表面,Cross-Encoder看内在

Bi-Encoder打分高,但Cross-Encoder打分低

= 这篇文档"看起来相关",但实际上不能回答用户的问题。这种文档就是噪声,正是Rerank要过滤掉的。

五、最优架构:先快筛再精挑

聪明的做法是两者结合,组成一个流水线:

图:RAG + Rerank 流水线 — Bi-Encoder快速召回20条,Cross-Encoder精选Top3

为什么要这样?

向量检索快,但不够准
Rerank准,但处理全量文档太慢
先快筛再精挑 = 又快又准

六、效果提升有多大?

简单说:加了Rerank,答案质量明显提升。降低了噪音,降低了幻觉。

七、阈值过滤:宁缺毋滥

图:阈值过滤 — 分数低于阈值的直接丢弃,不让大模型误导

Rerank会给每条文档打个分(0到1之间),但即使选出几条,如果分数都很低,说明知识库里可能根本没有相关内容

重要原则:

宁可告诉用户"找不到",也不要让大模型瞎编。

八、领域微调:让Rerank更懂你的业务

通用模型在专业领域有时会**“水土不服”**。

比如用户问"轻症赔付比例",但知识库写的是"轻度恶性肿瘤按基本保额的20%给付"。通用模型可能无法理解"轻症"和"轻度恶性肿瘤"是一个意思。

**解决方案:**用你的专业数据对模型进行微调。

不用太多数据,用你业务场景的几百条问答数据训练一下,效果就会有明显提升。微调后,模型对你的专业术语、表达方式理解得更准确,召回的内容自然更靠谱。

如果你做的是金融或保险相关的RAG系统,可以使用专门的领域微调模型来提升效果。比如StructBERT 金融领域FAQ问答模型,它是专门针对金融场景训练的,在金融数据上的表现比通用模型更好。

使用很简单:

几百条领域数据微调一下,Rerank对你的专业术语理解更精准,效果提升看得见。

总结

记住:

垃圾进去,垃圾出来。

RAG做不好,很可能不是大模型的锅,是前面的召回没做好。

加Rerank,是提升RAG效果最值得的一步。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 22:55:06

Scroll Reverser:彻底解决macOS多设备滚动方向冲突的终极指南

Scroll Reverser:彻底解决macOS多设备滚动方向冲突的终极指南 【免费下载链接】Scroll-Reverser Per-device scrolling prefs on macOS. 项目地址: https://gitcode.com/gh_mirrors/sc/Scroll-Reverser 你是否曾在触控板上享受自然流畅的滚动体验&#xff0c…

作者头像 李华
网站建设 2026/4/22 22:50:00

[Android] 桥架计算助手v1.0.7

[Android] 桥架计算助手v1.0.7 链接:https://pan.xunlei.com/s/VOqoMtVJdGuh4F5CNgcG5XHPA1?pwdsc2t# 桥架计算助手app是一款手机桥架计算软件,内置切口计算、角度计算、任意三角形计算、任意角度讲话、直角计算、死角计算、下翻直角计算、坡度计算、…

作者头像 李华
网站建设 2026/4/22 22:49:58

单片机控制板基础设计原则

问:单片机控制板设计的核心前提是什么?新手最容易忽略哪些基础原则?答:单片机控制板设计的核心前提是“稳定可靠、适配需求、易于调试”,所有设计环节都需围绕这三点展开,既要保证单片机核心模块正常工作&a…

作者头像 李华
网站建设 2026/4/22 22:49:57

智能合约安全终极指南:5大核心策略破解重入攻击全场景防御

引言:当区块链遇上"死亡循环"2016年6月17日,以太坊历史上最黑暗的时刻来临。The DAO项目——这个承载着区块链去中心化自治组织梦想的智能合约,在短短数小时内被攻击者利用重入漏洞窃取360万枚ETH,价值约6000万美元。这…

作者头像 李华