news 2026/3/20 8:46:25

【RAG召回排序】2025最全排序模型梳理

张小明

前端开发工程师

1.2k 24

文章封面图 — 【RAG召回排序】2025最全排序模型梳理

2025年检索重排模型全景盘点：从顶尖榜单到实用工具

在检索增强生成（RAG）和智能搜索领域，检索与重排模型的性能直接决定了系统的最终效果。今天我们就从权威排行榜出发，盘点当前最受关注的模型与工具。

一、权威检索重排排行榜速览

目前业内最受关注的两大检索重排模型排行榜分别是：

BGE-Reasoner 榜单（https://github.com/VectorSpaceLab/agentic-search/tree/main/BGE-Reasoner）：由向量空间实验室维护，聚焦于具备推理能力的检索模型，其榜单数据直接反映了模型在复杂场景下的信息筛选能力。
Bright Benchmark（<https://brightbenchmark.github.io）：一个综合性的检索模型评测平台，通过多维度的数据集和严格的评估指标，为研究者和开发者提供模型性能的客观对比。

这两个榜单是当前检索重排领域的风向标，能够帮助我们快速定位最前沿的技术成果。

二、Bright Benchmark 前五名深度解析

1. INF-X-Retriever（INF）

核心亮点：以63.4的总分大幅领先第二名，在榜单上形成断层优势，展现出碾压级的性能。
注意事项：目前仅支持英文场景，中文任务中无法直接使用，但其技术思路值得关注。

2. DIVER-v3-GroupRank（Ant Group & Sun Yat-sen University）

核心亮点：由蚂蚁集团与中山大学联合研发，以46.8分位居第二。它创新性地引入了分组排序机制，在处理大规模候选集时具备更优的效率与效果。
技术价值：其论文（https://arxiv.org/abs/2508.07995）详细阐述了分组策略的设计思路，对工业界落地具有重要参考意义。

3. BGE-Reasoner-0928（USTC & BUPT & BAAI）

核心亮点：由中国科学技术大学、北京邮电大学与北京智源人工智能研究院联合推出，是兼具推理能力与检索精度的代表模型。
生态价值：它不仅在榜单上表现优异，还拥有完整的开源生态（https://github.com/VectorSpaceLab/agentic-search/tree/main/BGE-Reasoner），便于开发者进行二次开发与部署。

4. Lattice Hierarchical Retrieval（UT Austin & UCLA & Google）

核心亮点：由德克萨斯大学奥斯汀分校、加州大学洛杉矶分校与谷歌团队共同开发，采用独特的分层格子结构，能够高效处理多粒度的语义信息。
开源支持：项目已开源（https://github.com/nilesh2797/lattice），其分层检索的架构设计为处理复杂长文本提供了新的技术路径。

5. ReasonRank (rerank RaDer)（RUC & Baidu & CMU）

核心亮点：由中国人民大学、百度与卡内基梅隆大学联合打造，是一款专注于重排任务的模型，通过对召回结果的二次精排，显著提升最终检索的准确率。
技术定位：它证明了在检索流程中，“重排”环节对最终效果的决定性作用，与“召回”环节同等重要。

三、其他值得关注的模型与工具

🌟 行业标杆与创新突破

hifi-rag：NeurIPS 2025冠军模型，其核心创新在于用大模型做内容过滤，打破了“唯召回率论”的行业惯性，强调“过滤效果才是提升RAG性能的关键”。
Youtu-Embedding：在CMTEB（中文多模态嵌入基准）榜单上效果最好的中文嵌入模型，是处理中文场景的首选方案之一。
ReasonEmbed：与BGE-Reasoner同属一个开源生态，专注于生成具备推理能力的文本嵌入，为后续的检索与重排提供了高质量的语义基础。

🛠️ 实用工具与衍生模型

jina-embedding：由Jina AI推出的轻量级嵌入模型，以高效的部署体验和稳定的性能，在开发者社区中广受好评。
conan-v1：一款新兴的重排模型，通过结合上下文感知的注意力机制，在动态场景下展现出出色的自适应能力。
Yuan-embedding-2.0-zh：其创新的训练范式值得研究，尤其在处理低资源语言和领域适配场景时，提供了新的技术思路。

📊 经典与生态工具

cross-encoder/stsb-roberta-base：经典的交叉编码器模型，在语义相似度计算任务中表现稳定，是许多重排系统的基线选择。
ColBERT：通过交互式注意力机制实现细粒度的语义匹配，是学术界和工业界都广泛认可的检索模型。
Qwen带提示词重排：基于通义千问大模型的重排方案，通过精心设计的提示词工程，充分释放大模型的推理能力来优化排序结果。
SBERT：经典的语义相似度模型，其论文（https://arxiv.org/abs/1908.10084）被引次数极高，至今仍是构建语义检索系统的基石。

🧩 Milvus 生态工具

Phrase Match：Milvus的短语查询功能，支持多个关键词短语的精确匹配，非常适合需要精准定位关键词的检索场景。
zilliz/semantic-highlight-bilingual-v1：Milvus推出的语义高亮模型，通过对召回结果的token级打分，能够更细粒度地计算句子与查询的相似度，提升检索结果的可解释性。

我可以帮你整理一份检索重排选型对照表，把这些模型的核心特点、适用场景和优缺点都列出来，方便你快速做技术选型。需要吗？

版权声明: 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！

网站建设 2026/3/13 21:46:37

Nature发表、Science点赞！清华揭秘AI让科学家走捷径却让科学走窄路

AlphaFold获得诺贝尔奖标志着人工智能工具已深入科学的核心地带。清华大学一项基于41,298,433篇论文的深度研究揭示了一个令人深思的悖论。AI显著提升了科学家的个人产出与职业进程，却导致整个科学探索的领域变得狭窄且固化。该研究发表在Nature上，而且被…

作者头像

李华

网站建设 2026/3/12 5:13:34

编程已终结！AI时代的原生智能软件架构长啥样？Claude给了个指南

近期，完全由 Claude code 自主编程开发软件已经成为现实，人们惊呼编程已经终结，该领域的奇点已至：革了程序员再革打工人：Anthropic 发布 Cowork，Claude Code 走进数字办公自动化。那AI时代的软件应该如何…

作者头像

李华

网站建设 2026/3/12 18:26:51

基于改进遗传算法的配电网故障定位Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。 🍎 往期回顾关注个人主页：Matlab科研工作室 👇 关注我领取海量matlab电子书和数学建模资料 &#…

作者头像

李华

网站建设 2026/3/18 12:06:50

从ChatBI到Agentic BI：衡石如何构建“自主决策与执行”的数据智能体

传统商业智能系统等待人类提出问题，新一代ChatBI系统接受人类用自然语言提问，而真正的Agentic BI系统则能够自主发现关键问题、分析问题并启动解决流程。这正是衡石科技正在构建的未来。01 进化之路，从被动应答到主动感知的必然转变数据分析领…

作者头像

李华

网站建设 2026/3/13 23:25:34

2025年华南理工大学计算机考研复试机试真题（解题思路 + AC 代码）

2025年华南理工大学计算机考研复试机试真题 2025年华南理工大学计算机考研复试上机真题历年华南理工大学计算机考研复试上机真题历年华南理工大学计算机考研复试机试真题更多学校完整题目开源地址：https://gitcode.com/u014339447/pgcode 百度一下pgcode 即…

作者头像

李华

网站建设 2026/3/14 3:39:20

救命神器！专科生必看10款一键生成论文工具TOP10测评

救命神器！专科生必看10款一键生成论文工具TOP10测评学术写作新选择：2026年专科生论文工具测评指南在当前高等教育日益普及的背景下，专科生群体在论文写作中面临着时间紧张、资料查找困难、格式不规范等多重挑战。为了帮助大家更高效地完成论…

作者头像

李华