当我们把 LLM 引入软件架构的核心时,奇点已然临近。软件不再仅仅是对人类指令的响应(response),而是开始展现出意图和自主性(agency)。
它不再是被动等待调用的工具,而是主动感知环境的观察者。
它不再是无状态的函数,而是拥有记忆与身份的实体。
它不再是孤立的计算节点,而是能够协作的社会成员。
意图理解
语义理解
目的识别
上下文关联(用户代码结构,当前文件目录,用户偏好,安全约束,历史任务上下文)
风险评估与澄清
记忆与身份
记忆
LLM 本身是无状态的。Agent 所谓的 “记忆”,实际上是通过上下文工程构建出的一种 “幻觉”。
短期记忆(Session Memory):记录当前会话的上下文,包括用户上一句话的内容、最近讨论的话题、代码片段,以及用户此前纠正过的误解等。
短期记忆使 Agent 能够实现以下目标。
在多轮对话中保持一致性。
避免重复提问。
进行上下文连续的推理。
长期记忆(Long-term Memory):借助向量数据库等技术,记录用户跨会话的偏好信息,例如以下内容。
用户偏好的代码风格。
常用工具栈(如 Python、LangChain、Spark)。
历史项目结构。
过往提出的问题类型。
用户的角色设定(例如,“你更偏好可读性高的代码”)。
身份:System Prompt的灵魂
身份(identity)远不止于人设,它是一套价值观与行为准则的集合,决定了 Agent 在面临两难选择时(如效率与安全之间的权衡)会倾向于哪一方。
记忆是“知道你是谁”,身份则是“知道自己是谁”。
一个成熟的 Agent 会在以下方面保持稳定。
表达风格。
专业领域定位。
价值观倾向(例如,偏向保守操作或注重安全)。
行动策略偏好(例如,先检查,再执行)。
上下文工程:理解世界状态
意图理解与身份信息使 Agent 明确 “你希望达成什么目标”,而上下文工程则使 Agent 理解 “当前世界的状况是怎样的”
提示工程解决的是“怎么说”,而上下文工程解决的是“给 Agent 看什么”。
输入不完整,推理就会偏离目标。
输入过多,模型难以抓住重点。
输入结构混乱,模型容易迷失方向。
上下文工程的目标:将 Agent 完成任务所需的最关键信息,以最合适的结构提供给模型。
上下文工程的 3 个核心来源如下。
用户上下文(User Context):涵盖用户的开发风格、历史偏好(如偏好的列表推导式)、常用技术栈(如 Spark、LangChain、FastAPI)以及当前工作内容(如正在编写爬虫或构建 RAG 系统)。一个优秀的 Agent 能够利用这些信息,自动调整回答的风格与推理深度。
环境上下文(Environment Context):用于理解“世界状态”,包括文件结构、代码库内容、当前分支、日志、错误栈、变量值、API响应以及运行时状态(如CPU、GPU 使用情况和任务状态)。调试型Agent必须先看到堆栈跟踪(Stack Trace),才能给出准确的建议。
任务上下文(Task Context): Agent 在执行任务时,必须掌握前序任务的结果、当前子任务的进度、依赖项是否已加载,以及工具调用的历史尝试记录。这是支持多步任务和复杂 Agent 工作流(如 LangGraph)所必需的能力。
随着上下文窗口扩展到20万个至100万个Token,上下文工程(尤其是信息的筛 选与压缩)变得更加重要:不能简单地将所有内容塞入上下文,而需要通过选择、摘要和结构化等手段,有效降低干扰。
上下文工程领域呈现出以下技术新趋势。
选择性上下文(Selective Context):精准筛选与当前意图紧密相连的内容,剔除无关信息,聚焦关键要素。
结构化摘要(Structured Summaries):针对历史内容生成结构化摘要,包括标题、关键发现和失败点等核心要素。
图结构上下文(Graph-based Context):将知识库构建为图结构,并依据节点重要性进行检索。
上下文优先级排序(Context Prioritization):由模型自主判断不同内容的权重高低。例如,有的模型引入了“思考模式”,赋予重要信息更高的优先级,使信息处理更加符合用户需求和场景要求,优化了决策依据的生成过程。
上述技术的本质都服务于一个共同目标:最大限度地减少噪声,同时尽可能突出关键信息。
任务拆解,把目标变为计划
任务分解(Task Decomposition)赋予了 Agent 将 “目标” 转化为具体 “步骤” 的能力,是衡量其智能化水平的关键指标。
任务分解包含两个关键环节。
规划(Planning):将总体目标拆解为若干子目标。
映射(Mapping):将每个子目标转化为具体的行动或可调用的工具。
这种“化整为零”的能力,使Agent能够处理远超单次API调用能力范围的长程复杂任务。
Agent 不再是单纯的单步执行者,而是具备规划能力的规划者(Planner),其核心在于引入了一个关键的中间层——规划层。
理解(Understand):将模糊的高层目标(如“优化数据管道”)转化为明确的技术需求。
规划(Plan):生成可操作的多步方案,如 “I/O 分析→算法优化→缓存策略”。
执行与反思(Execute and Critique):这是最接近人类智能的环节——Agent 在执行完第一步后,可能基于新信息主动调整计划。例如,“我查看了日志,发现 I/O 并非瓶颈,因此决定暂停原计划,转而排查 CPU 占用问题”。
这种动态规划能力,是 Agent 与传统自动化脚本的根本区别所在。
任务分解的三步法
现代 Agent 内部普遍采用三步策略。
理解目标:这并非仅仅解析字面意思,而是要洞察“真实需求”。例如,当用户说“清理一下昨天的日志”,其真实意图可能是压缩、分析或归档日志,而非简单地删除文件。
确定路径:将目标转化为清晰、可执行的流程。例如,加载日志文件→按日期分组→统计错误数量→生成分析报告→压缩原始日志。一个优秀的计划应具备以下特征:步骤简洁、无歧义、可成功执行、支持中断、便于检查,并能根据执行反馈动态调整。
管理执行:包括工具调用、失败重试、异常处理、结果验证,以及向用户汇报进度和动态调整计划。这一环节正是 LangGraph、AutoGen、CrewAI 等 Agent 框架的核心价值所在——让 Agent 从单纯的“聊天模型”真正升级为可靠的“任务执行者”。
2.学会自我审查
近期 Agent 研究领域呈现出一个明显趋势:在执行前对计划进行自我审查。
例如,DeepSeek、Qwen3等模型引入的“思考模式”,均强调先生成初步计划,再对该计划进行批判性分析,确认其合理性与可行性后,才进入执行阶段。
这一点非常关键,它使 Agent 的潜在错误在执行前就被识别和修正,从而避免在运行时酿成不可逆的事故。
3.任务分解与上下文工程互相强化
没有上下文工程,就无法正确分解任务;而没有任务分解,上下文工程也无从聚焦与取舍。二者相互依存,共同构成了 Agent 完整的“执行链路”。
这正是 Agent 与传统工具的根本区别;它不只是回答问题,而是真正开展工作。
上下文工程让 Agent “看得清楚” ——准确理解环境与需求。
任务分解让 Agent “做得正确”——将目标转化为可执行、可调整的行动路径。
二者共同构成了 Agent 时代的核心工程化能力,也是决定 Agent 能否超越 “高级聊天机器人” 的关键。
工具技能与行动策略,影响真实的世界
要真正成为人类的伙伴,它必须拥有“手”:能够调用工具、操作环境、执行动作。
工具使用(Tool Use),或更学术地称为行动(Action),是 Agent 获得“数字具身性”(Digital Embodiment)的关键。它使 Agent 从一个“被动的观察者”转变为“主动的参与者”。本质上,工具调用以语言模型为“大脑”,以各类工具为“身体”——通过语言理解与规划驱动外部的能力,实现对数字环境的真实干预。
Agent与传统聊天模型最根本的分野,不在于“回 答更准确”,而在于“能够行动”。要实现行动能力,Agent必须具备以下两项核心能力。
选择合适工具的能力:根据任务目标和上下文,精准匹配并调用最有效的工具。
制定安全、可靠、可预测的行动策略的能力:旨在规划清晰、可控且具备容错与调整能力的执行路径。
这两项核心能力共同构成了长尾任务执行的基础:没有工具调用能力的 Agent 只能“说”;而具备工具调用能力的 Agent 才真正能够“做”。
工具调用不仅仅是API
功能描述:这是写给模型看的“说明书”,用于说明工具的能力和适用场景,帮助模型判断是否应选择该工具。
参数约束:这是写给程序的“契约”,明确规定调用时所需参数的结构与类型,模型必须生成符合该规范的 JSON 输入。
副作用声明:这是写给安全模块的“警示”,用于标明操作的潜在影响(例如,该操作是否只读?是否会修改数据或触发外部系统?)。
{ "name": "query_sales_db", "description": "查询2020年及之后各季度的销售数据。仅支持 PostgreSQL 方言,且查询必须包含 WHERE 子句以限定时间范围。", "parameters": { "type": "object", "properties": { "sql_query": { "type": "string", "description": "符合 PostgreSQL 语法的 SELECT 查询语句必须包含 WHERE 子句" } } } }
从工具到技能
工具(Tool)是通用且原子化的操作,如“执行 SQL 操作”“发送 HTTP 请求”“读写文件”等。
技能(Skill)是面向业务场景、经过封装的能力单元,如“生成月度财报”“执行代码审查”“处理客户退款”等。
简言之,技能 = 工具 + 领域知识 + 标准作业程序。
为什么这一区别如此重要?因为单纯的 API 是冰冷且缺少上下文的。如果直接向 Agent 提供一个 delete_user 的 API,不仅存在危险,还可能引发不可逆的操作失误。
然而,如果将该 API 封装为一项 “用户注销技能”,并在其中内嵌标准作业程序(例如,备份数据→检查欠款→发送通知→删除操作),那么 Agent 获得的不只是一个原始功能,而是一种具备业务语义和安全约束的业务能力。
当企业将内部流程、规范和最佳实践封装为 Agent 可调用的“技能”时,便实现了知识的资产化。
Agent 不再只是一个通用模型,而是继承了企业 DNA 的 “数字员工”:它不仅知道 “怎么做”(调用 API),更懂得 “如何正确地做”(遵循标准作业程序)。
工具和技能选择
传统工具调用是机械式的:只要用户说“翻译”,系统就直接调用翻译工具,不加判断、不问上下文。
而在 Agent 时代,工具和技能的选择更像一位资深工程师的决策过程:是否需要调用工具?现在是不是恰当的调用时机?该选用哪个工具?当前上下文是否充分?是否存在潜在副作用?是否需要先验证输入?
核心循环ReAct
思考(Thought)→行动(Action)→观察(Observation)
这种 “行动增强推理”(Action-Augmented Reasoning)使 Agent 具备了试错和自我修正的能力。它不再依赖一次性给出完美答案,而是通过与环境的持续交互,逐步逼近正确的解决方案。
行动策略,安全与边界
行动策略(Action Strategy)决定了 Agent 是鲁莽地直接执行任务,还是谨慎行事并先由人类确认。其核心不在于如何执行任务,而在于何时暂停以进行验证或获取批准。为此,架构师必须设计以下 3 道防线。
只读沙箱(Read-Only Sandbox):在探索与信息收集阶段,仅允许 Agent 调用无副作用的工具(如搜索、读取日志、查询数据库)。这相当于为 Agent 设置了一道“婴儿围栏”,确保其在理解任务和制订计划时不会对系统造成任何不可逆影响。
人类介入(Human-In-The-Loop,HITL):在执行高风险写操作(如转账、删除文件、发送外部邮件)前,系统强制中断流程,清晰地展示拟执行的操作内容、上下文及潜在后果,等待人类明确批准后方可继续。
确定性护栏(Deterministic Guardrails):即使获得用户授权,底层执行层仍需要嵌入硬性规则校验(如“禁止删除根目录”)。
行动策略是 Agent 的 “行为规范”,包含以下 3 个核心层次。
安全:在执行任何操作前,Agent 必须具备 “暂停判断” 的能力,主动识别高风险行为(如删除系统文件、修改生产数据库等),并拒绝执行超出安全边界的危险操作。这是所有行业级 Agent 必须坚守的底线。
可解释:用户必须清晰地理解 Agent “为什么这么做”。Agent 应主动展示其计划、说明工具调用的原因,并报告每一步的执行结果。这不仅有助于建立用户信任,也为审计、追踪与调试提供了必要依据。
可控:在执行关键或不可逆步骤时,Agent 应支持用户介入。例如,提前展示即将执行的操作,明确询问“是否继续”,确保人类始终保有最终决策权。
工具使用赋予 Agent 影响现实世界的能力,技能为其提供职业素养,而行动策略则确保其行为是安全、高效且可信的。
三者共同构成了 Agent 从 “知识系统” 迈向 “执行系统” 的最后一块关键拼图。
人类接入的接口HITL
过去,人是操作员(Operator):亲自执行每一步操作,系统只是被动响应指令的工具。
未来,人是监督者(Supervisor)与评估者(Evaluator):不再事必躬亲,而是设定目标、审查计划、授权关键动作,并对结果进行判断与反馈。
这种关系的转变要求我们在设计系统时必须预留 HITL 接口。这不仅是为了安全、防止失控,更是为了在人类与 AI 的深度共生中,确保人类始终保有主体性。
至此,我们完成了对 Agent 这一概念的本体论定义。
它不是一段孤立的代码,也不是一个被动的工具,而是感知、记忆、推理与行动有机融合的数字存在。
它是我们在数字世界中的镜像——能理解我们的意图、延续我们的思维;也是我们的伙伴——能主动协作、承担责任,并在复杂环境中代表我们行事。
Agent的核心:感知-推理-行动循环
在传统软件架构中,无论是 MVC(Model-View-Controller,模型—视图—控制器)架构还是微服务架构,本质上都遵循线性管道模式:输入→处理→输出。数据在系统中流转,一旦处理完成,流转即停止。
然而,在 Agent 架构中,我们必须引入 “循环”(Loop)的概念。
Agent 并非一个 “函数”,而是一个 “进程” ——运行在一个 while(alive) 的无限循环之中。在这个循环中,感知、推理与行动并非孤立的步骤,而是彼此咬合、协同运转的 “齿轮”。
感知,主动的过滤器
Agent 的感知是主动的:它不仅接收信息,还会主动选择、解读并赋予信息以意义。
Agent的现代感知系统至少包含3个关键机制,分别是注意力、预测和语义化。
注意力
注意力(Attention)是感知的第一道选择器,如同聚光灯一般。模型的注意力机制,结合多模态模型(如 GPT-4o、Qwen-VL),能够对视觉信息、文本内容和历史上下文进行筛选,判断“哪些信息与任务目标相关”。
通过注意力机制,Agent 可以忽略无关的 HTML 标签,仅聚焦于网页正文内容。
通过向量检索,Agent 可以过滤掉 99% 的数据库记录,仅关注与当前任务相关的片段。
预测
Agent会基于历史对话、用户偏好和任务背景,构建一个“预测模型”。当现实与预测发生偏离时,便会产生“惊奇点”(Surprise)。
而这些惊奇点往往预示着新的价值、新的问题或新的矛盾。
语义化
不只是识别“老人”,而是判断其“可能是需要帮助的老人”。
不只是识别“文件”,而是意识到其“可能是被用户遗忘的配置文件”。
不只是识别“数字”,而是将其理解为“统计趋势的一部分”。
感知已从“是什么”跃迁至“意味着什么”。
因此,Agent的感知是一种“目标驱动的理解”,而非“机械式的输入”。
推理,快思考与慢思考
传统程序中的逻辑是确定性的:若A,则执行X;若B,则执行Y。
而 Agent 的推理则是柔性的、非确定性的,并且与经验紧密相关——它更像人类的思考过程,而非计算图的机械执行。
直觉式 / 快思考:基于 LLM 的概率预测直接生成回答,适用于闲聊、简单问答以及代码补全等场景。其特点是响应迅速、计算成本低,但容易产生幻觉。
逻辑式 / 慢思考:通过思维链,Agent 在输出最终结果前,会强制生成推理步骤、反思路径,甚至伪代码,适用于复杂规划、较慢、计算成本较高,但逻辑严密、可靠性强。
架构师面临的挑战在于“路由”:如何设计一种机制,使 Agent 在面对简单问题时调用 System 1,而在遭遇复杂任务时自动切换至 System 2?
Agent 推理通常包含以下 4 个关键层次。
情境理解(Situation Awareness)。Agent 需要回答:“当前到底发生了什么?”它会将感知到的信息与长期记忆和短期上下文相结合,构建出一个清晰的“任务场景”。
经验检索(Memory Retrieval)。Agent会自问:“我是否曾遇到过类似的问题?”这是推理过程中的重要加速器。大多数高性能模型(如OPenAI o1、DeepSeek-R1)依赖策略性记忆检索,以避免重复犯错。
心智模拟(Mental Simulation)。Agent 不会立即采取行动,而是先在“脑海中”进行预演:如果调用这个 API,会发生什么?如果读取该文件,能获得哪些信息?如果执行删除操作,是否会引发风险?推理的关键不仅在于逻辑本身,更在于其模拟能力。
决策与信心(Decision and Confidence)。Agent会对候选行动进行价值评估:哪个最符合用户目标?哪个最安全?哪个成本最低?同时还会判断:“我对这个选择有多确定?”Agent的本质不是“计算出唯一结果”,而是“通过思考进行权衡并作出决定”。
行动,改变与反馈
在传统软件中,输出(如 print 或 return)意味着执行的结束。
而在 Agent 架构中,行动则标志着环境改变的开始。
Agent 的价值在于其能够对现实世界产生切实影响:写入数据库、发送邮件、部署代码……行动是 Agent 的 “意图” 在物理世界或数字环境中的延伸。
而且,通过行动—反馈循环(Action-Feedback Loop),Agent能够在动态环境中“通过试错”不断调整策略,主动探测世界的边界并逐步适应。
传统程序是独白者,Agent 是互动者。
脚本:执行命令→结束。若出错,则程序崩溃。
Agent:执行命令 → 观察结果 → 若出错,则调整参数 → 重试。
引出了行动的 3 个新维度,分别是认识性行动、目的性行动和闭环行动。
认识性行动:行动即实验
这是 Agent 最深刻的特征之一。
传统程序通常只有在确定无误时才执行操作;而 Agent 却常常在不确定性中采取行动——因为对它而言,行动本身就是获取信息、消除不确定性的最有效手段。
这种 “为了获取信息而行动”,正是 Agent 区别于僵化脚本的核心特征。它并非盲目执行,而是主动以行动为 “探针”,去探测世界的边界、规则与反馈机制。
目的性行动:副作用是必需的
在函数式编程中,我们极力避免的“副作用”,在Agent架构中却成为其存在的核心目标。
Agent 的本质正是主动制造可控的副作用,以改变现实或数字环境的状态
修改数据库(改变数据状态)。
发送邮件(改变社会或协作状态)。
部署代码(改变系统运行状态)。
正因如此,Agent的行动模块必须内嵌世界模型校验(World Model Checking)机制:
“在执行此副作用之前,世界处于什么状态?执行之后,世界应变成什么样子?”
闭环行动:执行—验证—纠偏
行动不再是一个原子的“发射后不管”(Fire and Forget)操作,而是一个微型闭环结构。
每一次行动都必须伴随着一个明确的期望,并据此形成“执行—验证—纠偏”的反馈循环。
多Agent系统的编排
当我们将目光从单体 Agent 转向由多个 Agent 组成的网络时,软件架构的隐喻发生了又一次跃迁:从 “机械装置” 转变为 “社会组织”。
在单体 Agent 模型中,我们试图打造一个“全知全能的上帝”——它独自感知全局,推理一切,执行所有任务。
在多 Agent 模型中,我们坦然承认个体的局限,转而构建一个“各司其职、协同共进”的团队。
这不仅是 Agent 数量的简单叠加,更是复杂度管理范式的根本转变——从追求全能个体,转向设计高效协作的集体智能。
认识负荷的分流
Agent 不再仅仅是工具,而是承担特定职责的“角色”。单个 LLM 虽能完成各类任务,但容易出错、产生幻觉或遗忘上下文;而通过多个角色之间的对话与协作,系统更接近人类团队的思考与协作结构。
从架构的角度思考:为什么我们需要多个 Agent?为什么不能用一个超长的 Prompt 把所有要求都交给单个 LLM 呢?
答案在于 “认知的边际效应递减”。
上下文稀释效应:当 System Prompt 过长时,关键指令会淹没在大量信息中,导致模型遵循核心任务的能力显著下降。
角色泛化陷阱:一个既要编写代码,又要撰写文档,还要执行测试的通用 Agent,往往在各项任务上都表现平庸。它试图面面俱到,却难以在任何一项任务上做到专业。
角色冲突与思维模式不兼容:复杂任务往往要求不同的“思维模式”。例如,创造者(Creator)需要较高的 Temperature(温度)值,以激发发散性思维,鼓励创新和探索;而审查者(Reviewer)则需要较低的 Temperature 值,以保持收敛、严谨和批判性。若让一个 Agent 同时扮演“运动员”和“裁判员”,不仅会造成内部目标冲突,还容易引发“自我欺骗”(Self-Delusion)——模型在缺乏外部校验的情况下,将自身生成的错误合理化,误以为正确。
架构师的解决方案是采用垂直切分(Vertical Slicing),将一个庞大的任务(如“开发一款游戏”)按领域拆解为多个子域(如策划、美术、程序等),每个子域由一个专注(Narrow)的 Agent 负责。
多 Agent 的本质,是通过构建 “组织架构” 来弥补 “单体 Agent” 在认知能力、专注度与可靠性上的局限。
角色,协议与拓扑
角色:SOP的人格化
产品经理 Agent:只负责将模糊的用户需求转化为清晰的产品需求文档(Product Requirements Document,PRD)。
架构师 Agent:仅基于 PRD,输出系统接口定义与技术方案。
工程师 Agent:仅依据接口定义,生成可运行的代码。
角色的核心在于“关注点分离”(Separation of Concerns):每个 Agent 仅接收并处理与其职责相关的信息,从而有效维持上下文的纯净性与专注度。
协议:数字巴别塔的通用语
Agent 之间如何高效沟通?关键在于选择合适的“语言”。
自然语言:通用性强,适合内部推理与自由表达,但传输效率低、易产生歧义,不适合作为跨 Agent 的可靠通信载体。
结构化 Schema:现代多 Agent 架构倾向于使用标准化的数据格式(如 JSON)进行交互。
这种 “用自然语言思考,用结构化语言交流” 的模式,既保留了 LLM 的推理灵活性,又确保了系统间通信的精确性与可解析性,已成为构建稳定、可扩展多 Agent 系统的基石。
因此,Agent的协作离不开语言,而真正支撑协作的,是明确定义的通信协议。
MCP:模型与工具之间的协议——连接世界的“手”。它解决了“大脑如何指挥手脚”的核心问题。MCP将数据库、文件系统、SaaS接口等外部资源抽象并标准化为统一的“上下文资源”,使Agent对工具的调用转化为一种通用、结构化的RPC。可以说,MCP是Agent操作外部世界的USB接口——即插即用、协议统一、能力可扩展。
A2A 协议: Agent 之间的协议——连接思想的 “网络”。它解决了 “大脑如何与大脑协作” 的根本问题。A2A 协议定义了 Agent 间交互的标准流程,包括握手、协商、拒绝、任务交付等关键动作。其消息结构不仅包含内容本身,还嵌入了意图元数据。正如 TCP/IP(Transmission Control Protocol/Internet Protocol)之于互联网,A2A 协议是多 Agent 系统的基础通信层——确保不同角色、不同能力、不同来源的 Agent 能够互联互通、协同推理、可靠交付。
MCP 解决 “模型—工具” 的交互,A2A 协议解决 “模型—模型” 以及 “Agent—Agent” 的协作。
MCP 让 Agent 能够 “操作世界”,A2A 协议让 Agent 能够 “彼此协作”。
拓扑:权力的形状
Agent 之间的连接方式,从根本上决定了系统的协作性质与能力边界。
流水线(Chain):信息单向流动,结构清晰、延迟低,效率最高,适用于流程明确、具有高度确定性的任务。其代价是牺牲灵活性,难以应对动态变化或反馈需求。
层级式(Hierarchy):由一个 Manager Agent 统筹调度多个 Worker Agent,适用于需要复杂规划、任务分解与资源协调的场景。通过集中控制实现强大的任务管理能力,但以牺牲节点间的平等性为代价,可能抑制底层 Agent 的主动性。
联合式(Joint/Mesh):多个 Agent 以 “圆桌会议” 形式平等交互,通过辩论、协商甚至投票达成共识,适用于创意生成、战略决策等开放性任务,能够激发群体智能与涌现性创新。然而,这种模式通常通信开销大、收敛速度慢,以牺牲执行速度换取认知深度。
拓扑结构不仅是 Agent 之间的连接方式,更是权力与决策逻辑的具象化
架构师的核心职责,正是依据业务对“确定性”与“创造性”的权衡需求,在这3种“权力形式”中做出审慎取舍。
秩序的维持
当 Agent 数量增加时,系统便需要一个“大脑”来维持秩序,这个“大脑”就是编排器(Orchestrator)。
一旦系统中存在多个 Agent,核心挑战便不再是“单体 Agent 是否足够强大”,而是“多个 Agent 能否高效、可靠、有序地协作”。这正是 Orchestration(Agent 编排)的核心使命。
编排器本身不仅是一个 Agent,更是一种运行时。它的具体作用如下。
协调各角色的职责边界。
调度任务的流转与依赖。
监控执行状态与异常。
推动整个团队向目标收敛。
多 Agent 系统的编排器承担以下五大核心职责。
调用顺序
Agent并非随意介入,而是严格遵循预设或动态生成的协作流程。例如,搜索 $$\rightarro$$ 阅读 $$\rightarro$$ 分析 $$\rightarro$$ 写作 $$\rightarro$$ 批判 $$\rightarro$$ 修订。编排器如同工厂流水线的调度中枢,确保每个Agent在正确的时机接手任务,维持整体工作流的有序性与连贯性。
数据流动
一个 Agent 所生成的洞察、分析或总结,如何可靠且高效地传递给下一个协作方?
答案在于:编排器维护一个全局上下文。该上下文作为协作过程中的“共享记忆”,结构化地承载任务演进的每一步成果。
search_agent 的检索结果传递给 reader_agent。
reader_agent 生成的摘要传递给 analyzer_agent。
analyzer_agent 提炼的洞察传递给 writer_agent。
writer_agent 撰写的初稿传递给 critic_agent。
这种机制确保信息在角色间精准流转、无损继承、可追溯演化,避免了重复推理或上下文断裂。这正是上下文工程在多 Agent 系统中的核心实践——将协作流程转化为受控、有序、可审计的上下文演进链。
Agent选择
当一个任务存在多个可胜任的 Agent 时,由谁来执行?这正是编排器的关键决策点。
编排器需要综合评估多个维度,包括能力、负载、成本和可靠性,动态选择最优执行者。未来,这一机制将深入融入 A2A 协议:每个 Agent 可主动广播结构化的“能力描述”,包含其技能集、性能指标与服务等级。编排器据此实现自动化、实时的执行者匹配。
条件分支与循环
现实世界的任务从来不是线性的——测试未通过时,需要返回开发者修改并重新测试;审稿未达标时,应退回写作者重写。
因此,编排器必须像一个状态机:根据每个 Agent 的执行结果动态跳转到不同协作步骤;支持循环、回退与重试,直至满足预设的收敛条件。这种机制使整个多 Agent 系统不再是一条僵化的流水线,而是一个具备反馈、自省与演进能力的鲜活组织——能够自我迭代、持续优化,并最终向目标稳健收敛。
并行与资源管理
搜索并处理 50 篇文献,不需要由单个 Agent 依次阅读 50 次——完全可以并行阅读、并行分析、并行核查。
这正是编排器的核心价值:高效调度计算与认知资源,让多 Agent 结构转化为如同“多核 CPU”般的协同引擎——各核心(Agent)专注于执行子任务,整体系统实现吞吐量与效率的指数级提升。
单体 Agent 负责能力:在特定领域深度执行。
编排器负责流程:决定谁在何时做什么,如何组合结果,以及如何应对异常。
多 Agent 系统的强大能力,并非源于单体智能的叠加,而是源于精心设计与动态调控的协作结构。
这正是多 Agent 系统从 “混乱聊天” 迈向 “可控、可靠、可扩展工程系统” 的关键跃迁。
冲突与共识
冲突是智能的必然副作用,也是复杂系统生命力的源泉。如果多个 Agent 始终意见一致,那便不是智能系统,而只是一个回音室。
多 Agent 系统中的冲突处理机制大致可分为 4 种。
投票机制:快速而实用
适用于单步骤决策、方案差异较小且成本敏感的场景。常见策略包括多数投票(majority vote)、加权投票(weighted vote)和基于置信度的投票(confidence score vote)。
目前,多数 LLM 系统采用此类方法提升输出的稳定性。例如,3 个 Agent 生成不同方案后,通过投票选出最可信的答案;在 ReAct 风格的工具调用中,也可借助投票机制避免幻觉导致的错误工具调用。
辩论机制:生成质量更高的答案
这是 DeepMind 和 OpenAI 多次验证有效的方法:让两个或多个 Agent 围绕同一问题展开辩论,互相质疑、反驳与完善,最终达成一个质量更高、偏差更小的结论。
该机制的优势如下。
Agent 会主动暴露其推理链。
谬误与认知偏差更容易被对方识别和纠正。
结构化的冲突有助于激发更深层次的洞察。
辩论机制适用于复杂推理、模糊任务以及对解释性要求较高的场景。
仲裁机制:当双方僵持不下时的最终裁决
在企业级系统中,这一机制尤为关键:当多个 Agent 坚持不同结论、无法达成一致时,需要引入一个“最终决策者”进行裁定,以避免系统陷入无休止的争执或死锁。
该仲裁者可以是人类专家、能力更强的 LLM 或一个专门设计的 “反思型 Agent”,其核心作用是综合各方观点、评估证据权重,并作出权威判断,从而保障系统整体的效率与一致性。
共识机制:逐步收敛的智能协作
这是最复杂,却也最接近自然界与社会系统运作方式的冲突解决模式。其核心流程:提出初始提案 → 收集反对意见 → 修订提案 → 再次提出提案,循环往复,直至不再出现实质性异议。
该机制借鉴了区块链中的共识算法(如拜占庭容错)思想,并广泛应用于多人协作写作、长文规划以及多 Agent 共同制定战略等场景。其关键优势在于:并非强行统一意见,而是通过持续吸纳少数派观点,不断优化和完善方案。
冲突并非系统故障,而是智能涌现的源泉。
唯有能够有效处理冲突的多 Agent 系统,才能真正构成智能群体。
涌现与自组织
当协作网络建立起来后,最引人入胜的现象——涌现便出现了。
涌现现象的底层机制
为何一群行为简单的 Agent 组合在一起,竟能展现出超越个体的智能?其背后的核心是两个系统动力学机制。
对抗催生质量: DeepMind 的研究表明, 让两个 Agent 就同一问题展开辩论, 再由第三个 Agent 进行总结, 所得结果的准确性显著优于单一 Agent 的自我反思。原因在于: 幻觉往往在内部逻辑上是自洽的, 个体难以自行察觉; 而对手 (Opponent)则带着批判性视角,能迅速识别并指出其中的逻辑漏洞。
异构催生全能:通过组合具有不同专长的模型,系统可实现能力互补。例如,由擅长逻辑推理的 GPT-4 负责任务规划,擅长长文本处理的 Claude 3 负责文档解析,而经过微调的 Llama 3 则专注于生成 SQL 查询。这种“混合专家”式的宏观架构,不仅充分发挥了各模型的优势,还在整体成本与性能之间实现了最优平衡。
自组织系统的核心特征
更前沿、更具未来潜力的协作范式,并非依赖中央“编排器”发号施令,而是让系统在无中心控制的情况下自发协调、动态调整,共同完成任务——这便是自组织(self-organization)。
自组织系统具备以下特征。
无中心(Decentralized):系统中没有管理者、调度者或中央指挥者。每个 Agent 自主评估任务、独立作出决策,并根据局部信息与其他 Agent 互动。这正如蚁群协作觅食——不需要“蚁后”发号施令,个体通过简单规则与环境反馈,共同完成复杂任务。
自主分工(Autonomous Division of Labor):任务并非由中央指挥者指派,而是由 Agent 主动从任务池中选取愿意参与且能胜任的任务。部分任务可能需要协作完成,此时团队由 Agent 自行发起、协商组建,并动态调整成员,包括加入或退出。整个组织结构持续自适应演化,其运作机制类似于一个自由市场:供需驱动、能力匹配、自愿协作。
动态拓扑(Adaptive Topology):系统结构并非预先设定或静态不变,而是根据运行状态持续演化。例如,当沟通成本过高时,团队自动精简规模;当技能缺口出现时,Agent会主动学习新技能;当冲突频发时,各方会协商形成新的合作规则;当任务遭遇瓶颈时,系统会自动将其分解为更易处理的子任务。整个系统如同具备“组织智能”,能自发“生长”出最适合当前问题的协作架构。
基于信誉的进化(Reputation-based Evolution):在去中心化网络中,信任即货币。系统通过类似 GitHub 的星标、StackOverflow 的声望积分或区块链中的信誉评分机制,对 Agent 的行为进行持续评估。表现优异的 Agent 将获得更高的信誉分,从而优先获取任务分配、计算资源或协作机会。这种机制不仅激励高质量贡献,还逐步演化出一套面向 AI 的社会信用体系,驱动整个群体向更高效、更可靠的方向演进。
从单体 Agent 到多 Agent 系统,我们见证了一个全新组织形式的诞生。这不仅是技术跃迁,更是对“智能”“协作”与“创造”本质的重新定义。
软件开发范式的根本转变
具有涌现能力的系统最迷人的特质在于其不可预测性:在这样的系统中,美不再源于精确与对称,而来自动态平衡与有机生长。
当成百上千的 Agent 开始协作,并逐步形成自己的社会结构、经济机制乃至文化规范时,我们所从事的便不再是传统意义上的编程,而是在孕育一个全新的数字文明。
新的开发范式更像园艺而非建筑:我们不再试图从头到尾精确设计每一个细节,而是 营造适宜的环境、设定初始规则、引入多样性的“种子”,然后让系统自行生长与演化。最终,我们创造的不是静态的程序,而是一个活的系统——其中复杂的算法会自发涌现,甚至可能孕育出人类未曾设想的解决方案。
从单体 Agent 到多 Agent 系统,我们见证的不仅是技术的进步,更是一场 “世界观” 的深刻重构。
从机械到有机:软件不再是冰冷的机器,而是可以视为具有生长、适应与协作能力的生命体。
从控制到引导:我们不再试图掌控每个细节,而是通过设定规则与激励机制,引导系统向期望的方向演化。
从完美到适应:目标不再是追求零错误的“完美”,而是构建在不确定环境中持续生存与优化的强适应性。
从静态到动态:软件不再是完成即固定的产物,而是始终处于变化、学习与成长中的动态存在。
从设计到涌现:最卓越的特性往往并非预先设计而成,而是在复杂交互中自发涌现的结果。
开发者的角色:从“建筑师”到“园丁”
传统软件工程信奉 “设计决定一切”,习惯于自上而下地规划每一个模块、接口与流程。然而,在多 Agent 系统中,这种 “上帝” 视角已然失效——当成百上千个 Agent 持续交互、学习与适应时,其在第 N 轮可能涌现出的状态,早已超出了任何预先设计的边界。
面对这种不确定性,我们的角色发生了根本性转变:不再试图拧紧每一颗螺丝、控制每一个齿轮的转动;而是专注于营造适宜的土壤、光照与气候——构建健康的协作生态,让智能在其中自然生长、互动与演化。
涌现的美学启示我们:最伟大的创造并非源于精雕细琢的完美设计,而是诞生于简单规则在复杂互动中的无限组合。
当我们放下对确定性的执念,转而拥抱协作中的张力、冲突与多样性,智能便会在连接的缝隙中悄然萌发、自然生长。
这不仅是一场技术的革命,更是一次对生命本质的数字回归——在代码与算法之中,重现有机、演化与共生的古老智慧。
我们完成了从“单体”到“社会”的关键跨越。
不再执着于训练一个完美无瑕的模型,而是致力于构建一个高效、有韧性且自适应的智能组织。
不再困于单体 Agent 的幻觉或局限,而是通过协作机制、冲突解决与集体验证,系统地抵消个体的不可靠性。
至此,我们的 Agent 不仅拥有了身体(执行能力)、心智(推理与学习能力),更建立了社会关系(协作、分工与信任机制)。它已不仅仅是一个“数字个体”,更具备了孕育“数字社会”的潜力——一个由互动、规则与涌现共同塑造的新型文明基底。
新的契约:人机协作的设计原则
2026 年开始,AI 的生产方式悄然改变。
代码:80% 由 AI 生成,人类负责审查。
流程: 70% 的业务流程由AI动态规划,人类负责设定目标。
角色:设计、编码、测试、运维等环节均已引入 AI 伙伴。
当人机契约从 “控制”(Control)转向 “对齐”(Alignment),人类需要从 “指令发出者” 转变为 “协议制定者”。
互补而非替代
在现代 Agent 系统中,人类与 AI 并非竞争关系,而是基于角色分工(Role Partitioning)的协作关系。其核心原则可概括为:人类负责意图,AI 负责行动。
这并非抽象概念,而是现代 Agent 框架(如 LangGraph、CrewAI、AutoGen)已在实践中采用的真实分工模型。
第 1 步(Human):输入最小人类意图单元(Minimum Human Intent Unit, MHIU),例如,“分析 DeepSeek-R1 与 Qwen3 的推理风格差异”。
第 2 步(Agent):由规划器生成执行计划。
第 3 步 (Agent): Worker Agent 并行执行搜索、分析与对比等任务。
第 4 步(Human):通过 HITL 机制进行价值判断与最终决策。
AI 可能迅速偏离正轨,但人类负责确保最终的正确性与价值导向。
角色 | 意图 | 价值判断 | 方向选择 | 战术探索 | 计划生成 | 子任务执行 | 最终审核 |
人类 | √ | √ | √ | √ | |||
AI | √ | √ | √ |
透明与可解释
信任并非盲目,而是建立在理解的基础之上。
Agent 不能仅提供一个结果,还必须提供 “认知的审计日志”。
级别 | 解释对象 | 场景 | 解释内容示例 |
直觉级 | 最终用户 | C端产品 | “我推荐这个方案,是因为它成本最低。” |
概念级 | 业务专家 | 辅助决策系统 | “经过对历史数据的分析,我发现模式A与当前情况的匹配度达到了73%。” |
技术级 | 开发者 | Agent调试后台 | “Based on CoT reasoning step 4, tool search_db returned...” |
人类保持主导权
无论 AI 多么强大,关键的“核按钮”必须始终掌握在人类手中。
Agent 必须内置一套 “自我怀疑机制”:当遇到以下情形时,必须强制挂起操作并主动请求人类介入。
高风险操作:涉及金额超过 1000 元,或执行数据删除等不可逆操作。
低置信度:推理结果的置信度低于0.6。
伦理敏感:涉及隐私、偏见、歧视或处于法律边界模糊地带的情形。
理想情况下,Agent的所有操作都应具备可逆性。对于不可逆的操作(如发送邮件),必须引入时间锁(Time Lock)机制,例如,延迟10s发送,以便为人类提供撤回的机会。
共同学习与成长
人机协作并非静态关系,而是一个双向的学习过程。
AI 向人类学习:通过人类的反馈(如 RLHF )、修正和示范,AI 逐步捕捉并内化人类的偏好,将人类的隐性知识(Tacit Knowledge)转化为可操作的显性知识。
人类向 AI 学习: AI 展现出的涌现行为能够启发人类突破思维定式,发现全新的问题解决路径。
人机协作必须建立在共同的伦理基础之上,而其最高境界是实现创造性的融合。