news 2026/4/25 17:48:26

Agent-as-a-Graph:大模型多智能体系统工具与智能体精准检索新范式

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agent-as-a-Graph:大模型多智能体系统工具与智能体精准检索新范式

本文提出Agent-as-a-Graph方法,将智能体和工具作为平等节点构建二分图知识图谱,解决多智能体系统中精准检索痛点。通过向量初筛、类型加权RRF融合和图遍历聚合三步流程,Recall@5提升18.6%,且不依赖特定Embedding模型,具有跨模型泛化能力强、可手动调优等优势,显著提升检索效率和准确性。


当前大语言模型多智能体系统面临的一个核心痛点:如何在成千上万个工具和智能体中,精准找到最适合当前任务的那一个?

  • Agent-Only检索(智能体导向)智能体描述往往无法覆盖其工具库的全部能力。
  • Tool-Only检索(工具导向)把每个工具当作独立个体。这忽略了工具间的协同效应

Figure 1: 传统方法与Agent-as-Graph对比

传统方法要么只能看到"智能体层面",要么只能看到"工具层面",无法在统一空间中进行权衡。

💡 二、把智能体和工具都变成图谱节点

核心思想:Agent-as-a-Graph

研究团队的天才之处在于:不再把智能体和工具看作两个独立层级,而是将它们作为平等节点放入知识图谱

整个系统被建模为一个**二分图 G = (Agents, Tools, Edges)**:

  • 智能体节点(𝒜):包含智能体名称和描述
  • 工具节点(𝒯):包含工具名称和描述
  • 所有权边(E):明确连接每个工具到其父智能体

这种方法一举三得:

  1. 细粒度匹配:工具节点保留了具体功能描述
  2. 上下文保留:通过图遍历总能回到父智能体
  3. 统一检索:在同一个向量空间中对齐两种节点

三步检索流程(Algorithm 1)

Algorithm 1: Agent-as-a-Graph检索算法

第一步:向量初筛对查询q,从工具库𝒞ₜ和智能体库𝒞ₐ中分别检索Top-N候选(N ≫ K),得到两个初始列表。

第二步:类型加权RRF融合这是论文的神来之笔!传统RRF对所有结果一视同仁,但论文提出按节点类型加权的RRF(wRRF)

α(工具节点)α(智能体节点)

其中α_𝒜和α_𝒯是两个可解释旋钮,允许你手动调优智能体覆盖度与工具精度的平衡!这种方式既保留了RRF的鲁棒性,又引入了对异构节点的灵活控制。

第三步:图遍历聚合从融合后的列表中逐个取出节点,如果是工具则通过owner(e)函数找到其父智能体,最终聚合出Top-K个可执行智能体。

📊 三、效果显著且架构通用

基准测试结果(Table 1)

Table 1: LiveMCPBench基准对比

使用OpenAI text-embedding-ada-002模型的结果显示:

  • Recall@5达到0.83,比之前的SOTA(MCPZero)提升18.6%
  • nDCG@5达到0.46,显著高于其他基线
  • 超过39%的检索结果来自智能体节点,34%通过工具边追溯获得,证明两类节点都不可或缺

跨模型泛化能力(Table 2)

Table 2: 不同嵌入模型的性能对比

最令人振奋的是,这个方案不挑Embedding模型!在8种完全不同的嵌入架构上测试(从谷歌Vertex AI、亚马逊Titan到OpenAI和开源的All-MiniLM-L6-v2):

  • 平均Recall@5:0.85 vs 0.70(提升19.4%)
  • 标准差仅0.02,性能波动极小
  • 甚至在小模型All-MiniLM-L6-v2上也提升了19.4%

这说明改进来自图谱结构本身,而非特定向量表示,对生产部署极其友好!

类型权重调优(Figure 2 & Table 3)

Table 3: 加权RRF配置对比

Figure 2: 不同类型权重配置的性能曲线

通过网格搜索发现:

  • 最优比例:α_𝒜:α_𝒯 = 1.5:1(智能体权重稍高)
  • 极端偏向会损害性能(3:1智能体偏重导致Recall降至0.76)
  • 相比标准加权RRF,类型特定权重设计额外提升2.41%

这种可解释、可手动调优的特性,让运维人员能根据领域特点灵活调整,无需重新训练模型。

如何学习AI大模型?

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!


第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

大模型全套视频教程

200本大模型PDF书籍

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

大模型产品经理资源合集

大模型项目实战合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 17:47:04

STL练习

2058: [STL训练]Whos in the Middle 题目描述 FJ is surveying his herd to find the most average cow.He wants to know how much milk this median cow gives:half of the cows give as much or more than the median; half give as much or less. Given an odd number …

作者头像 李华
网站建设 2026/4/25 17:46:53

电商行业的数据分析与优化策略

电商行业的数据分析与优化策略关键词:电商行业、数据分析、优化策略、用户行为、销售预测摘要:本文聚焦于电商行业的数据分析与优化策略。首先介绍了电商数据分析的背景,包括目的、预期读者、文档结构和相关术语。接着阐述了核心概念&#xf…

作者头像 李华
网站建设 2026/4/25 19:38:43

BLE服务特征描述

在蓝牙规范中通常指 GATT 服务 (Service) 与特征 (Characteristic) 的概念及其层级关系。GATT 数据模型层级在低功耗蓝牙 (BLE) 中,设备连接后通过 GATT (通用属性协议) 进行数据交换。其数据模型是一个三层结构:服务 (Service) → 特征 (Characteristic…

作者头像 李华
网站建设 2026/4/17 19:15:10

UART寄存器分类介绍

一、UART 寄存器的核心分类通用 UART 模块的寄存器通常分为控制类、状态类、数据类、配置类4 大类,不同 MCU 的寄存器名称可能不同,但功能一致。二、通用 UART 寄存器详解1. 数据寄存器(Data Register)功能:存储待发送…

作者头像 李华
网站建设 2026/4/22 20:35:39

AI智能体架构全景解析:从基础到应用的完整指南

本文综述AI智能体架构,从三个维度分析:审议与推理、规划与控制、工具调用与环境交互。文章组织了智能体组件、编排模式和部署场景,探讨了设计中的关键权衡(延迟与准确性、自主性与可控性、能力与可靠性)。同时强调评估…

作者头像 李华
网站建设 2026/4/17 23:20:07

学术论文AI写作:7款工具操作技巧与案例解析

工具核心特点速览 工具名称 核心优势 适用场景 数据支撑 aibiye 全流程覆盖降重优化 从开题到答辩的一站式需求 支持20万字长文逻辑连贯 aicheck 院校规范适配模板化输出 国内本硕博论文框架搭建 覆盖90%高校格式要求 秒篇 3分钟文献综述生成 紧急补文献章节 知…

作者头像 李华