news 2026/6/14 5:49:35

AI Agent—Vibe coding

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI Agent—Vibe coding

目录

目标:

一、软件工程三部曲

1、总体框架

2、软件 1.0 — 显式编程(Explicit Programming)

1. 核心思想

2。特点

3、软件 2.0 — 模式识别(Pattern Recognition)

1.核心思想

2.特点

4、软件 3.0 — Agent 时代(The Agent Era)

1.核心思想

2.特点

二、未来工程师的方向

1、Vibe Coding 是什么?

2、不需要背 API

旧方式:历史工具箱(History Toolbox)

新方式:AI Agent + 工具墙(Tool Wall)

3、Vibe Coding 的三步法

1. 描述意图:从「怎么做」到「做什么」

2. 管理上下文:划定工作范围

3. 验收结果:从「监工」到「质检官」

三、AI Agent的核心

1、总体框架:核心循环

2、三个阶段分别做什么

1. 感知(Perception):不只是“听”,更是“理解”

2. 规划(Planning):从“目标”到“路线图”

3. 行动(Action):从“思考”到“动手”

3、核心逻辑一句话

4、与传统 LLM 的区别

5、用“整理会议纪要”串起来


目标:

本文聚焦于以下三个方面:

1、软件工程的历史迭代三部曲

2、未来工程师的发展方向

3、AI Agent的核心是什么


一、软件工程三部曲

1、总体框架

阶段名称核心范式人的角色

1.0

显式编程

人写代码、写逻辑

工程师写每一行逻辑

2.0

模式识别

数据驱动、模型学习

准备数据、设计模型、训练调参

3.0

Agent 时代

目标驱动、自主推理与工具调用

定目标、验质量,不再逐行实现

本质变化:从“人告诉机器怎么做”,到“人告诉机器要什么”。


2、软件 1.0 — 显式编程(Explicit Programming)

1. 核心思想

软件行为由工程师显式编写的规则决定。改功能 = 改源码里的if-else、函数、流程。

  1. 代码编辑器

    • 示例:script.py里手写greet(name),用print输出问候语。
    • 逻辑、分支、输出都由人逐行定义。
  2. 流程图

    • 工程师写 if-else → 判断条件 → True 走 Action A,False 走 Action B。
    • 典型确定性、可逐行追踪的控制流。

2。特点

  • 优点:行为可预期、可调试、可审计,适合规则清晰的系统。
  • 局限:复杂场景规则爆炸;每变一次需求都要改代码、发版。
  • “解决方案”是什么:就是源代码本身。

3、软件 2.0 — 模式识别(Pattern Recognition)

1.核心思想

不再手写全部规则,而是用数据 + 模型从样本中学习规律。行为藏在权重和特征里,而不是显式的if-else

  1. 神经网络结构

    • Input → Hidden Layers → Output
    • 标注:Forward Pass、Loss Function、Backpropagation、Optimizer
    • 即:前向推理 → 算损失 → 反向传播 → 优化器更新参数
  2. 应用示例:图像分类

    • 输入:猫狗图片
    • 经过 Model Classification / Feature Extraction
    • 输出:Cat / Dog 分类结果

2.特点

  • 优点:适合视觉、语音、推荐等“规则难写、模式难穷举”的任务。
  • 局限:要数据、算力、标注;可解释性弱;改行为往往要重训或微调,不是改几行 Java。
  • “解决方案”是什么:训练好的模型 + 数据集与训练流程。

4、软件 3.0 — Agent 时代(The Agent Era)

1.核心思想

从“写程序 / 训模型”升级到 自主 Agent:理解高层目标,自己规划步骤,调用浏览器、代码、支付、搜索等工具完成任务。人主要负责定目标和验结果。

  1. “黑盒模式”(The Black Box Mode)

    • 人提供:Data、Set Goals(目标)、Hyperparameters(超参)
    • 机器内部推理与执行对人来说更像黑盒,但对外能完成复杂任务。
  2. 自主 Agent 能力图

    • 中心:带“眼睛”的大脑(推理)
    • 外围:Browser、Code、Payment、Tool Use、Search
    • 强调:推理 + 多工具编排,不是单段固定脚本。
  3. 工作流示例

    分析用户角色、发现异常并写报告

    Fetch Data → Analyze Anomalies → Generate Copy → Format Output

    一条自然语言目标,Agent 自己拆步骤并执行。

  4. 人的角色演变

    • PAST(细节执行者):人被代码和细节淹没。
    • PRESENT(目标定义者 & 质量检查者):人指向 Goal,Agent 执行,人做验收。

2.特点

  • 优点:复杂、跨系统、多步骤任务可用自然语言驱动;迭代快(改 prompt、改工具、改目标)。
  • 局限:结果稳定性、安全边界、成本与可审计性仍是挑战;关键系统仍需人工把关。
  • “解决方案”是什么:往往是 Prompt、目标、工具链、评估标准,而不一定是传统意义上的“改 App 一个类”。

二、未来工程师的方向

1.从「实现者」到「意图架构师」

  • 少写样板代码,多写 目标、场景、体验预期

  • 像产品经理 + 架构师:说清楚「要什么」,不必事必躬亲「怎么写」

2. 从「API 调用者」到「Agent 编排者」

  • 不必死记 Auth、Payment、Map 等 API

  • 会 选 Agent、配工具、拆任务,让 Agent 完成集成与调用

3. 从「个人编码」到「上下文管理者」

  • 维护 文档、规范、约束,构成 Agent 的「工作区」

  • 用 Rules、Skills、.context/等把团队知识结构化,减少 AI 乱改、跑偏

4. 从「代码监工」到「结果质检官」

  • 审查重点从 diff 行数 → 功能、边界、安全、用户体验

  • 建立测试清单、回归场景、上线标准,对 交付物 负责


1、Vibe Coding 是什么?

Vibe Coding 被定位为软件 3.0 的一种新开发范式,核心是一次 「维度升级」:

过去(Coding)未来(Vibing)

写代码、写语法、写 if-else

传递 意图(Intent) 与 氛围/方向(Vibe)

关注「怎么实现」

关注「要达成什么、体验如何」

工程师 = 代码生产者

工程师 = 意图表达者

一句话:从「写代码」变成「把想法说清楚,让 AI 去落地」。


2、不需要背 API

旧方式:历史工具箱(History Toolbox)

  • 木箱里堆满 API Manual、Docs Reference 等厚重文档
  • 工程师要 记忆、查阅、手写 各类 API 调用
  • 能力边界常受限于「记得多少、查得多快」

新方式:AI Agent + 工具墙(Tool Wall)

  • 墙上挂着模块化能力:Auth API、Data API、Payment API、Map API 等
  • AI Agent 根据任务自动选工具、组合调用
  • 人的工作从 「API 调用」 变成 「选择合适的 Agent」

含义:具体 API 细节由 Agent 和工具层承担,工程师不必把文档背进脑子,而要会选 Agent、会描述需求、会设边界。


3、Vibe Coding 的三步法

1. 描述意图:从「怎么做」到「做什么」

传统 CodingVibe Coding

对话框里是if/elsefor、异常处理等实现细节

自然语言描述目标,例如:「做一个能自动整理会议纪要并生成 Action Items 的工具」

人写「每一步怎么做」

人写「最终要什么」

未来能力:把模糊需求写成清晰、可执行的目标(功能、用户、约束、成功标准)。

2. 管理上下文:划定工作范围

输入作用

Context Docs

项目背景、架构、业务文档

Best Practices

编码规范、设计模式、团队约定

Constraints

安全、性能、合规等硬性边界

人的角色标注为 「Goal Definer & Guardrail Setter」(目标定义者 + 护栏设置者)——拿大笔划定范围,而不是自己敲每一行代码。

未来能力:为 Agent 准备上下文、设规则与禁区,让 AI 在「对的范围里」自主执行。

3. 验收结果:从「监工」到「质检官」

旧方式(Code Review)新方式(Outcome Inspection)

工程师弯腰盯屏幕,逐行审代码

工程师对照 交付物 做结果验收

角色像工地 监工:管过程、管实现

角色像 质检官:管结果是否符合意图

压力大、细节多

更关注「会议纪要表」是否完整、Action Items 是否准确

未来能力:定义验收标准,从用户价值、正确性、风险角度验结果,而不是只验语法。


三、AI Agent的核心

AI Agent 的核心运行逻辑:不是“一问一答”,而是一个持续运转的感知 → 规划 → 行动闭环。

1、总体框架:核心循环

Agent 的本质是一个循环体:

感知 → 规划 → 行动 →(环境变化)→ 再感知 → …

每一轮行动都会改变环境(生成文件、写入数据库、调用 API 等),Agent 再根据新状态进入下一轮,直到目标达成。


2、三个阶段分别做什么

1. 感知(Perception):不只是“听”,更是“理解”

  • 输入来源:语音、文字指令、上下文文档等
  • 关键能力:通过“理解模块”,把人类自然语言转成内部可处理的任务表征
  • 要点:感知不是原样接收,而是结构化理解——弄清目标、约束、上下文

2. 规划(Planning):从“目标”到“路线图”

  • 输入:理解后的高层目标(如“整理会议纪要”)
  • 关键能力:任务分解,拆成可执行步骤,例如:
    1. 转文字
    2. 提取要点
    3. 分类
    4. 生成行动项
    5. 格式化输出
  • 要点:规划是把模糊目标变成有序、可执行的执行计划

3. 行动(Action):从“思考”到“动手”

  • 角色:Agent 像指挥家,按规划调度工具
  • 工具库:语音转文字 API、摘要模型、Markdown 文件、数据库、知识库等
  • 要点:行动不是只生成文本,而是调用外部能力,真正改变环境、产出结果

3、核心逻辑一句话

理解用户意图 → 拆解成执行路线 → 调度工具落地 → 观察结果并继续迭代


4、与传统 LLM 的区别

维度传统 LLMAI Agent

交互模式

单次问答

持续循环

任务处理

直接生成回答

先理解、再规划、再执行

能力边界

模型内部知识

模型 + 工具 + 环境

输出

文本

可操作的实际结果


5、用“整理会议纪要”串起来

  1. 感知:接收会议录音、补充说明、历史文档 → 理解为“需要结构化纪要”
  2. 规划:拆成转写、提炼、分类、行动项、排版等步骤
  3. 行动:调用转写 API、摘要模型,写入 Markdown/数据库
  4. 再感知:检查输出是否完整、格式是否正确,必要时进入下一轮修正

总结:AI Agent 的核心逻辑是 “理解 → 分解 → 执行 → 反馈” 的闭环;模型负责推理与决策,工具负责与真实世界交互,循环负责持续逼近目标。这也是 Agent 能从“聊天”走向“做事”的根本原因。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 16:02:03

DDrawCompat:3步解决Windows 11上经典DirectX游戏兼容性问题

DDrawCompat:3步解决Windows 11上经典DirectX游戏兼容性问题 【免费下载链接】DDrawCompat DirectDraw and Direct3D 1-7 compatibility, performance and visual enhancements for Windows Vista, 7, 8, 10 and 11 项目地址: https://gitcode.com/gh_mirrors/dd/…

作者头像 李华
网站建设 2026/6/14 5:41:15

KeSpeech技术揭秘:开源多方言语音数据集的技术实现与生态价值

KeSpeech技术揭秘:开源多方言语音数据集的技术实现与生态价值 【免费下载链接】KeSpeech The repo provides information about KeSpeech dataset. 项目地址: https://gitcode.com/gh_mirrors/ke/KeSpeech 在人工智能语音技术快速发展的今天,方言…

作者头像 李华
网站建设 2026/6/14 5:48:59

别再死记硬背了!用Python手把手带你模拟汉明码的编码与纠错全过程

用Python动态模拟汉明码:从编码到纠错的沉浸式实践指南汉明码作为经典的前向纠错编码技术,在计算机组成原理课程中常被视为"理论难点"。传统教学往往聚焦于数学推导和静态案例分析,而本文将带您用Python构建一个交互式汉明码实验室…

作者头像 李华
网站建设 2026/6/14 5:41:32

从零搭建骑手实时追踪系统:GPS失效、坐标系混用与轨迹跳点排查实战

一、背景:一个看起来简单的需求 最近在做一个同城配送系统的重构,其中一个核心模块是骑手实时位置追踪。 需求很明确: 用户可以看到骑手实时位置能计算距离预计到达时间动态更新 整体流程看起来并不复杂: 骑手 App → 后端 →…

作者头像 李华