news 2026/5/15 2:34:12

Agent进化史:从被动应答到主动规划

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agent进化史:从被动应答到主动规划

在 Agent(智能体)成为主流之前,AI 大模型领域其实已经积累了深厚的技术底座。简单来说,Agent 是把这些成熟技术“串联”起来,赋予了 AI 主动规划、使用工具和记忆的能力。

以下是 Agent 出现之前,大模型及相关领域的核心技术栈:

1. 基础架构与训练范式

这是大模型的“地基”,决定了模型能“懂”多少知识。

  • Transformer 架构:2017 年提出的自注意力机制(Self-Attention),彻底取代了 RNN/LSTM,让模型能并行处理长序列,是当今所有大模型的基石。
  • 预训练(Pre-training):让模型在海量无标注数据上“自学”,掌握语言规律、世界常识和逻辑推理。这是大模型“聪明”的来源。
  • 指令微调(Instruction Tuning):让模型学会“听懂人话”并执行指令,而不仅仅是续写文本。这是 Chatbot 时代的开端。
  • 人类对齐(RLHF/RLAIF):通过强化学习,让模型输出符合人类价值观、安全且有用。这是让模型“懂事”的关键。

2. 核心交互技术

在 Agent 出现前,模型主要靠这些技术与人类“对话”。

  • 提示工程(Prompt Engineering)
    • 零样本/少样本学习(Zero/Few-shot):通过巧妙的提问方式,让模型在不训练的情况下完成特定任务。
    • 思维链(Chain-of-Thought, CoT):引导模型“一步步思考”,极大地提升了复杂推理(如数学题、逻辑题)的能力。
  • 上下文窗口(Context Window):从最初的几千 token 扩展到现在的十几万甚至百万 token,让模型能“阅读”整本书或长文档,但这依然属于被动记忆。

3. 应用层关键技术

在 Agent 能“自主行动”之前,人们主要靠这些技术让模型“干活”。

  • RAG(检索增强生成)
    • 模型本身记不住私有数据或最新新闻,RAG 技术让模型先“去数据库查资料”,再根据查到的内容回答问题。这解决了幻觉问题,是当时最热门的技术之一。
  • Function Calling(函数调用)
    • 注意:这是 Agent 的前身!在 Agent 流行前,开发者已经学会了让模型识别意图,并输出标准的 JSON 格式来调用 API(比如查天气、查股票)。
    • 区别:当时是“人写代码控制流程,模型负责调用”,而 Agent 是“模型自己决定调用什么、何时调用、调用结果如何”。
  • 代码解释与生成(Code Interpreter)
    • 让模型写 Python 代码,然后在沙箱里运行,以此解决数学计算、绘图或数据处理问题。这其实是 Agent 中“工具使用”能力的雏形。

4. 评估与优化

  • 基准测试(Benchmarks):如 MMLU、GSM8K 等,用于量化评估模型的智力水平。
  • 模型蒸馏(Distillation):用大模型教小模型,让模型在保持性能的同时体积更小,适合端侧部署。

总结:从“被动”到“主动”的跨越

在 Agent 出现之前,大模型更像是一个**“博学的顾问”**:

  • 你问,它答;
  • 你给指令,它执行;
  • 你给工具,它调用。

Agent 带来的本质变化,是将上述技术(特别是 Function Calling + 规划 + 记忆)整合成了一个**“闭环系统”**:

  1. 感知:理解复杂任务。
  2. 规划:自己拆解步骤(以前需要人写代码拆解)。
  3. 行动:自主调用工具、检索信息。
  4. 反思:如果失败了,自己调整策略重试(以前需要人报错重启)。

所以,Agent 并不是凭空出现的新技术,而是大模型能力成熟后,自然进化出的自动化执行形态

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/15 2:32:05

2000-2024年国家级大数据试验区A股数据 多期DID模型+stata代码

2000-2024国家级大数据试验区A股数据 多期DID模型资料详情1. 数据范围:2000-2024年全部A股上市公司国家级大数据试验区相关数据2. 研究方法:复刻《财经研究》《财经科学》等顶刊思路,以国家级大数据综合试验区建设作为准自然实验,…

作者头像 李华
网站建设 2026/5/15 2:31:04

智启日常,效率倍增:2026 年 AI 赋能成长全指南

2026 年 5 月,AI 技术正以前所未有的速度渗透生活与工作的每一个角落,从国产大模型深度适配中文场景,到 AI 笔记本、行业专用解决方案陆续落地,人工智能早已脱离 “高深概念” 的标签,成为普通人触手可及的能力工具。当…

作者头像 李华
网站建设 2026/5/15 2:19:14

Karate测试框架:一站式API、UI和性能测试的终极解决方案

Karate测试框架:一站式API、UI和性能测试的终极解决方案 【免费下载链接】karate Test Automation Made Simple 项目地址: https://gitcode.com/gh_mirrors/ka/karate 还在为复杂的测试自动化工具链而烦恼吗?想要一个能统一API测试、UI自动化、Mo…

作者头像 李华
网站建设 2026/5/15 2:17:49

2026 大模型 API 中转站亲测思路:别急着看价格,先看这 5 个关键指标

做 大模型 API 中转站评测 时,如果只盯着价格,结论通常会失真。对真实项目来说,兼容性、稳定性、模型覆盖、计费透明度和技术支持 才是更关键的评测维度,而像 简易 API 这类开发者平台,往往会在这些指标上更有代表性。…

作者头像 李华
网站建设 2026/5/15 2:15:03

ARM架构SCTLR_EL1寄存器详解与配置指南

1. ARM架构中的SCTLR_EL1寄存器概述在ARMv8/v9架构中,系统控制寄存器(System Control Register)是处理器核心的关键配置组件,而SCTLR_EL1作为异常级别1(EL1)的系统控制寄存器,承担着管理系统行为…

作者头像 李华