AI Agent从入门到入土：2025年大模型编程开发必学技术，金融架构师亲授企业级落地实战，小白也能秒变“Agent“大神！-洪萨配资

一、AI+时代的数智生态

首先从总体上与大家分享 AI+时代的数智生态，AI+时代是最近倡导的 AI+行动的一个非常重要的组成部分，我们在 AI+时代要倡导的几个方向。

AI+时代：数智燎原的商业机遇与技术进步

在AI+时代的数智· 燎原趋势之下，商业机遇和技术进步有哪些？

左边是 Gartner 发布的 2025 AI 技术相关的生命周期，如图所示，AI Agent 正处于技术顶峰，其在国内已涌现了大量的框架和产品落地。根据 Gartner 的预测，AI Agent 将在未来 2-5 年进入瓶颈期和稳定期，所以现阶段应该是其发展的关键窗口期。

右边展示的是技术演进的研究，绿色的模型逐渐向红色 Autonomous Agents 方向发展，它是一个慢思考的过程。随着今年年初推理大模型的兴起，大模型从单一的能力逐渐转化为智能体方向，它有很强的推理能力、工具调用能力，也能生成很强的企业级应用。

AI+时代：从传统 AI 到 Agent AI 的方法进化

从传统 AI 到 Agentic AI 方法经历四个阶段，四个阶段分为三大部分：

传统方法：2000-2010 年以传统机器学习模型或 NLU/NLP 方法构建模型，直到从传统方法扩展到深度学习构建的神经网络，用各种方法训练神经网络，在数据集上达到完美的效果后推出第二部分。
大语言模型：自2022年 ChatGPT 发布以来，大模型技术路径从预训练+微调扩展到上下文学习，并推动了 Few-Shot 及 Zero-Shot 学习方式普及。企业无需在从头设计复杂的神经网络结构，也不需要有太多的训练数据。通过上下文提示词就能理解需求，产生相关的应用。
Agent+函数调用：随着大模型推理能力增强，可以用 Agent + Function Calling 的方法构建出我们自己的这种能力，所以就到了最后一个阶段，从传统的 AI 到深度学习阶段再到 Agentic AI 的智能体化的 AI 方向。

AI+时代：AI 数智化技术生态

在 AI 数智化的技术生态，我将它归结为四个阶段，第一就是任何用户都可以使用 ChatGPT、豆包、 DeepSeek，通过提示词工程提出问题，上手的门槛非常低，交互也极为便捷。

第二种是智能体，我们构建智能体侧重于人机协同（ Human-in-the-loop）的交互，可应用于智能客服、推荐系统及各类企业级运维应用。后面两种方法分别是大模型微调和预训练，它们从数据层面更深入地影响模型，技术门槛和前期投入也更高。

在这四个技术阶段中，今天重点探讨第二阶段，也是应用最广泛、各个企业落地效果最为明显的过程 — AI Agents。

AI+时代：AI Agent 进化方向

我将 AI Agent 的进化归结为五个方向：

一是基于规则的 Automation。以 2010 年前后兴起的 RPA 机器人流程自动化技术为代表。我曾在一家股份制商业银行从事 RPA 机器人平台的构建和运营，基于规则的自动化用 RPA 机器人实现了很多单一流程，局限在于它无法完成一些自适应工作或智能化程度不足。
二是智能化 intelligence 阶段，将基础模型和架构引入进这个过程，并对架构做了一些改造，将模型能力做了一个台阶。这个阶段局限在于模型的能力有限，且数据可能有不足或质量不高。
三是 Agentic Workflow，我觉得这是当前最重要的阶段，我们通过智能体方法补全模型能力，利用模型之长补模型之短，从而构建企业内部的智能体，用一个 Workflow 方法将工作流串联起来。
第四阶段和第五阶段是半自动化和全自动化。从行业咨询和企业内部的分析来看，大部分金融类公司应该处于第三阶段，就是 Agentic Workflow 逐渐向全自动化的方向发展。大家可以看到就是自动化程度越高，构建成本也越高，陡坡就越陡，对技术架构、技术生态产生了很大的影响。

如何在一个企业中有效地构建这一路径？就是今天要讨论重点议题。

AI Agent 技术进化：工作流 Agent -> 推理 Agent -> MAS 系统

AI Agent 的进化过程，简单将它分成了三个阶段，从 2024 年开始构建 Agentic Workflow，形成了工作流的 Agent。如果大家从事过提示词工程或大语言模型的工作，就会发现有相当一部分工作是在写提示词（现在也是）。提示词工程喜欢用一句 Step-by-step 来描述，因为当时大语言模型上下文能力是不足的，推理能力还需激活，所以在 2024 年构建 Agent 方向更多是工作流式的。

2025 年随着模型推理能力的进一步提升及强化学习技术的推动，推理 Agent 逐渐结合了模型和对应工具的 Function Calling 能力，包括 2025 年推出的很多协议，将工具调用能力提上了一个很高的水平，工具调用能力和准确度越来越强，同时更加标准化，数据传输格式也有了新发展。

从现在趋势来看，未来应该是 Multi Agents 方向，即智能体之间是有明确分工的相互协作，就像人类在团队和组织中也有明确的分工，而且更加能够有规划的任务发挥，充分发挥人机协同的最大效率，让人和机器之间的协同度更高，这是我对于 AI agent 技术进化的一个思考。

二、AI Agent 早期技术

这一部分将从两个时间点： 23->24，24->25年简单梳理一下 AI Agent 技术演进的部分内容，以时间线方式展示给大家。

Agent 开发初期技术栈（23-24年）

Agent 技术栈主要分为：底层模型、上层开发框架、引出的核心能力及 AI Agent 场景。很明显底层模型具有多样性，任何模型的 Function Calling 能力不一样，既有国内也有国外（开源和闭源）。

核心能力是通过开源框架和模型结合产生的能力，核心能力在框架里都有相关的封装。

AI Agent 基本框架

AI Agent 框架的核心架构通常分为四块：规划（Plan）、记忆（Memory）、工具（Tools）与行动（Action）。其运作机制是以大模型作为核心规划器（Plan），凭借记忆模块提供的上下文进行决策，并通过调用外部工具来扩展能力边界，行动之后，其结果反馈给大模型。这个过程中可以用提示词进行设计和串联。

AI Agent 设计范式

随着 AI Agent 的发展和应用，可以总结出很多范式。第一种是 Single Agent。后来根据企业内部的工作流程发展成 Agentic Workflow ， Agent 逐渐嵌入到企业级的工作流中，通过工作流完成相关的工作，达到一个智能交互的作用。

第三种是 Multi-Agent System，即 MERS。多智能体之间可以相互赋予角色之间的协同。这是现阶段大体上 AI Agents 方向上的三类设计范式。

在构建企业级 Agent 时，第一步是考虑哪种范式来解决问题？选一个框架、模型生成自己的应用系统。这三部分就是我们的 Design Pattern，集成内部的工具，最后去做评估（Evaluation）。

Single Agents 示例

Single Agent 在 2023 年相对是火的，我们使用 Single Agent 构建了销售咨询的 Chatbot 系统。记得带领团队研发 Chatbot 时，还没有很多 Workflow 框架可以用，更多是 Python 代码结合工作经验来开发智能对话机器人。智能 AI 机器人与基于传统机器学习方法不同，更多结合大模型能力，使用提示词工程并调用工具，而且要做好一些校验工作，才能将 Chatbot 对话机器人能力发挥到极致。

Agent 经典范式

2022 年一篇论文提出了 ReAct 模式，该模式将大语言模型内在推理能力与对外部环境的交互相结合。具体而言，模型在完成任务时，会动态生成思维链用于自主推理，并根据推理结果主动调用外部工具或执行行动。行动产生的结果会作为关键观察信息反馈给模型，进而更新并引导其后续的思维链，形成“推理 → 行动 → 观察 → 再推理”的增强型决策循环。

ReAct 模式在 23 年也是非常火热的，落地了很多相关框架。

Multi-Agent System

另外值得注意的范式是 23 年出现的斯坦福大学虚拟小镇 Multi Agent System 案例。小镇通过虚拟多个 Agent 相互协作来完成工作。但在 23 年，Agent 之间如何进行标准协作能力仍待完善，每个 Agent 后面相对应都是一个大语模型，对于 TOKEN 的算力消耗是十分巨大的，运行起来的代价也是巨大的。

自主规划 Agent 的持续进化

从 23 年起，Plan-and-Executor 范式逐渐兴起，其核心是通过提示词引导模型对任务进行规划，再分步执行，并根据每步结果反馈到大模型，以动态优化执行过程。到 25 年 Routine 范式出现。这种范式将 Planning 生成了一个模型，通过模型的方法更进一步的去固化 Routine 方法，让 Routine 过程更加标准化。同时我对输出的结果进行了一些外部工具的调用进行校验，这是大体上的两篇论文提到的一个自主规划智能体的智持续进化的过程。

自主规划 Agent 典型示例：AutoGPT

23 年自主规划智能体或叫这种类型的智能体的一个典型的范式就是 AutoGPT，AutoGPT 及后来的 MetaGPT 和 BabyAGI 是最早开始用规划-执行-反馈的方法，就是说如何让规划执行的准确性更高，然后让这种方式逐步落地。23 年年底也逐渐被一些框架集成，形成一个典型的示例用例的范式，现在这个开源项目也在持续的维护中。

LangChain 技术生态兴起

另外一个情况是从 2022 年底到 23 年，LangChain 技术生态逐渐兴起。之前很多传统的机器学习和深度学习框架更多基于 Python。而 LangChain 生态的兴起做了一个很好的补充，尤其是为企业级 Agent 开发做了很好的项目搭建，集成了很多工具调用能力，符合了很多 Chain 方法，将提示词模型和输出进行了连接。这个过程中也定义了自己的协议。它将一些服务化能力集成进来，形成了 LangServe 和 LangSmith 的开发者的平台和监控的过程。

LangChain 的模块化设计与生态基础设施

LangChain 采用模块化设计，具备开箱即用的特性。其生态建设在 2023年逐渐完善，至 2024年已基本上达到可在企业内部适用。然而，在 2025年实际应用中也暴露出一些问题，稍后与大家分享。

Agent 开发框架：LangChain 与 LangGraph

2024年的7月，LangChain 社区推出了 LangGraph。LangGraph 是从 Single Agent 逐渐进化为 Agentic Workflow 方式。为了更好的支撑工作流，它采用有向状态图建模执行流将多个 Agent 串联起来。

Agent 开发框架：LIamaIndex

最后涉及到的开发框架是 LLAMA Index，与 LangChain 相比集成度更高（尤其对于数据处理工作流自动的做了集成），包括连接器和结构化工具。

模型推理加速持续进化：Ollama->vLLM->SGLang->?

大模型在企业应用中面临运行成本高昂的挑战，因此推理加速成为关键。以 Ollama 项目为起点，后逐渐衍生出 vLLM 和 SGLang 等框架，这些框架通过对模型进行高效的量化与推理加速，为企业级 Agent 落地奠定了基础。

三、AI Agent 新生技术

随着推理模型能力越来越强，平台层面逐渐出现了低代码（Lowcode ）工具，这是 25 年新生技术里最重要的指标。

Dify 一站式智能体研发解决方案

Dify 作为一站式解决框架是这方面的代表。企业内部现在用的也比较多，它基于开源框架，可以进行二次开发。

LangChain 和 Dify 的两种选择

LangChain 和 Dify 该如何做选择？作为企业架构师一般两者都要选择。使用 Dify 更强调的是原型与 MVP 阶段的验证。LangChain 对于模块化、结构化产品平台落地有很大的效果。

AI Agent 交互协议的兴起

24 年底到 25 年，AI Agent 交互协议逐渐兴起，Agents 与工具之间、Agents 之间出现了很多标准化交互协议，进一步完善了 AI Agent 技术生态。

3.1

MCP 协议的主要组成

其中最关键是 MCP 协议，它解决了模型间 Function Calling 能力参差不齐、缺乏标准化的问题。在此过程中，可以构建众多 MCP Server，尤其对于外部系统，其设计很大程度参考了早期互联网中 Web Service 的方式，以此构建 MCP 协议及 MCP Server 的实现路径。

3.2

A2A 协议：不同 Agent 之间架起的桥梁

A2A 协议是在不同技术架构的 Agent 之间建立桥梁。大家都知道国内的 Agent 有不同的技术架构，国外的 Agent 开发框架也有不同的技术架构。它们两者之间如何去通信，更多的是基于 A2A 协议，或者是有更新的协议，那么它们如果能通信的话，那么对于企业之间或企业内部的不同的功能之间的这种相互通信建立一个很好的桥梁。

下一代 AI 核心：上下文工程

下一代 AI 的核心在 25 年的时候提到了，就是上下文工程，那么到底是微调还是上下文工程，是我们最重要的一个关键指标，就是用上下文工程解决了大部分的问题，然后用微调解决小部分的问题。这个在企业内部实践当中，我一会展开，再跟大家具体的聊一下。

四、AI Agent 企业级研发实践

最后一部分将探讨企业级 AI Agent 在金融行业的研发实践，并从金融架构师的角度提出若干核心建议。

企业级研发设计思维的进化

企业级研发的设计思维从最早的面向对象，到面向服务的 SOA 架构，再到微服务架构持续演进。直到去年以来兴起的智能体架构，标志着从信息化、数字化到智能化的深刻转变。智能体架构的引入，不仅带来了全新的模型与智能化能力，还因其需要调用外部工具并建立新的通信协议，从而催生并推动了新架构思维的发展。

数智原生化架构

在金融企业落地较多的是数智原生化架构，这种架构是基于分层的思想，是将“数”（DataOps）和“智”（LLMOps）结合在一起，在基础模型、数智化模型和 Agent 基础上做一个分层。基于这个架构实现出了数智原生架构的企业级要素和架构，大体上分为五个层次，五个层次之间用协议互联。

数据：数据+知识
智：模型+本身的工具，抽象出工具层
协议：工具和模型之间的通信采用 MCP 协议，Agent 之间采用 A2A 协议

在这个基础上，能够更好分层协议，沉淀原子能力。

企业数据治理

企业级 Agent 研发有两点不可忽视：第一，数据治理仍是基础。从参与过金融企业 AI 项目来看，尤其在架构设计层面，数据始终是关键要素。数据的层次有很多，可以考虑五点。我们采用 FastAPI 网关封装出数据网关，通过该网关将 SQL、文档、缓存、向量及图数据进行相关整合，使每类数据均可清晰表示与调用。在这个过程中，我们也对加密存储、脱敏和安全输出做了管控，右边是架构图。

企业级“护栏”

第二个重点是“护栏”。风控是金融企业的核心。风控过程中，最主要是建立输入和输出的护栏。如上图右侧所示，绿色表示金融企业构建智能体平台需要建立的输入和输出护栏。输入护栏既可以是模型也可以是白名单过程，同时也可以建一些工作流，进行人工二次抽检。

四个底线和三层治理

最后展示的在金融行业 Agent 企业研发中的四个底线和三层治理。安全与治理对于金融公司的 Agent 企业架构相当重要。三层治理架构解析如下：

任务解析：当用户输入需求后，首先进行意图识别、任务分解与护栏验证
规划分层：通过工作流引擎，将已验证的任务步骤串联为可执行的规划
执行优化：对执行过程与输出结果进行管控和优化

该治理架构可结合工作流、模型、提示词工程及企业内部 API 协同实现，从而系统化保障 Agent 在金融场景中的安全、合规与可控。

“从用户出发”的产品能力+大模型能力+AI 工程化

企业级研发能力到底是什么？从架构师视角看，是从用户出发的产品能力+大模型能力+ AI 工程化能力。当我们接到了一个 AI Agent 的需求后，第一步不是直接对模型选型，而是从用户价值出发，对具体场景、产品目标与能力要求进行拆解，明确哪些部分适合由 AI 实现，哪些应沿用传统方法。这应是企业级 Agent 研发首要思考步骤。

AI 工程化不能只有大模型能力

企业级 AI Agent 研发实践绝非仅依赖模型或 AI 技术，更需要完善子系统的支撑。其中，对话引擎和意图识别尤为关键。意图识别广泛应用对话机器人、推荐系统、AI 应用乃至智能运维场景。它能够精准定位并拆解具体问题，有效弥补当前大语言模型在专业场景下通用能力的不足。

落地中的角色

在企业级 Agent 落地过程中，非技术层面的角色分工与协作同样重要。我们建立的全栈式团队协作——例如我当前和以前金融公司的 AI 团队，均采用这种模式。团队中每个成员都是全栈图谱中的点，将这些节点结合在一起，就能实现 1 + 1 + 1 > ∞ 的效应。

企业级 Agent 需求层次

构建数智化原生企业应用，其需求应遵循漏斗状过程。主要将其归纳为：概念论证、定义原型到产品化，三个过程相辅相成。最重要的定义原型阶段。对于原型定义，我们通常会用一到两个月，通过 AI 或 Agent 进行快速验证。若验证成功，我们则用半年到一年时间将其产品化。

已在多个场景中得到应用：包括保险经纪公司对话机器人、互联网金融公司的推荐系统，以及后续 AIOps 运营平台，均取得了较好实践效果。

尊重客观规律，实践重于一切

最后与大家分享企业数智燎原的关键，就是尊重客观规律，实践重于一切。一切必须从企业实际出发——当前有什么，为什么要做，哪些适合 AI 做，哪些不适合？这个过程最关键的思考是如何从 0 到1的建设中，哪些是真正重要的？列好优先级清单。以上就是我简要分享，感谢各位聆听。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

【毕业设计】基于springboot的员工考勤系统(源码+文档+远程调试，全bao定制等)

AI Agent从入门到入土：2025年大模型编程开发必学技术，金融架构师亲授企业级落地实战，小白也能秒变“Agent“大神！

一、AI+时代的数智生态

二、AI Agent 早期技术

三、AI Agent 新生技术