news 2026/5/4 12:23:07

【Karpathy】 最新分享:【Coding AGI 】已来

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Karpathy】 最新分享:【Coding AGI 】已来

Karpathy 说:AI 接管 80% 代码时,他看清了 AGI 的魔法。从 2025 年 12 月起,Coding Agent 从“基本没啥用”突变到“基本能用了”,他自己的工作流从“80% 手写 + 20% AI”翻转为“80% AI + 20% 人类微调”,并宣布:最热门的新编程语言是英语。这不是炒作,而是他作为 20 年老程序员亲身经历的范式转移:从 Vibe Coding 升级为Agentic Engineering,从敲代码变成“指挥 Agent 干活 + 审查结果”。

这篇文章带你拆解 Karpathy 的核心判断,并结合 Software 1.0/2.0/3.0、闭环尝试、声明式指令、MCP/TDD 等实战,说清楚:为什么 Coding AGI 不是噱头,而是已经发生的现实

目录

一、为什么说【Coding AGI】已来?

1. Karpathy 的亲身“翻转时刻”

2. 2025 年 12 月:一个清晰的“质变点”

二、从 Software 1.0 到 3.0:编程范式的三次重写

1. Software 1.0:人写规则(显式代码)

2. Software 2.0:人训模型(权重即程序)

3. Software 3.0:人写 Prompt(LLM 即解释器)

三、从 Vibe Coding 到 Agentic Engineering:Coding AGI 的真正形态

1. Vibe Coding:门槛极低,但“碰运气”

2. Agentic Engineering:从“写提示词”到“指挥 Agent”

四、AGI 魔法真相:闭环尝试 + 声明式指令

1. 韧性(Tenacity):AI 最大的超能力

2. 声明式指令:给“终点”,不给“路线图”

3. TDD + MCP:把韧性变成工程能力

五、程序员怎么办:废用性萎缩 vs 10× 杠杆

1. 废用性萎缩:手写代码能力在退化

2. 10× 杠杆:顶尖工程师的收益更大

六、实战指南:如何从 Vibe Coder 升级为 Agentic Engineer

1. 工作流升级示意

2. 三条马上能用的实战原则

七、避坑指南:Coding AGI 不是万能药

结语:Coding AGI 不是未来,而是现在


一、为什么说【Coding AGI】已来?

1. Karpathy 的亲身“翻转时刻”

在 2025 年 11 月,Karpathy 的工作流还是:

  • 80% 代码自己手敲
  • 20% 交给 AI 补全

短短几周后,二八比例直接180° 对调

  • AI 接管了 80% 的代码工作
  • 他只负责 20% 的微调与审查36kr.com+1

他自己说:

我现在基本上是在用英语编程,虽然有时多少会觉得有点伤自尊,但那感觉还是太值了。36kr.com

更关键的是,他认为这不是他一个人的体验:

我预计已经有两位数百分比的工程师正在经历类似的转变,而普通大众对此的认知程度,感觉还停留在个位数的低水平。36kr.com

也就是说:Coding AGI 的体感,已经不是未来时,而是现在进行时

2. 2025 年 12 月:一个清晰的“质变点”

Karpathy 反复强调一个时间点:2025 年 12 月

  • 2025 年 12 月前:Coding Agent “基本没啥用”,只能做点玩具和 Demobaai.ac.cn
  • 2025 年 12 月后:模型质量、长期一致性、韧性突然跃升,能扛住大型长时任务baai.ac.cn

他举了一个自己搭“监控视频分析仪表盘”的例子:

登录 DGX Spark,设置 SSH 密钥,安装 vLLM,下载测试 Qwen3-VL,创建推理服务,搭 Web UI 仪表盘,测试功能,用 systemd 配服务,还要写一份 Markdown 报告。
Agent 30 分钟全搞定,中间遇到的问题都是自己上网查资料解决的。
三个月前,这活至少要一整个周末baai.ac.cn。

结论
Coding Agent 已经从“副驾驶”变成“驾驶员”,人类从“写代码”变成“启动任务 + 审查结果”。这就是他说的:

编程正在被重构。在编辑器里输入计算机代码的时代已经结束。baai.ac.cn

二、从 Software 1.0 到 3.0:编程范式的三次重写

Karpathy 用一套经典框架解释这一切:Software 1.0 / 2.0 / 3.0

1. Software 1.0:人写规则(显式代码)

  • 人类写if-else、循环、函数,规则全部写在代码里
  • 机器只是“照本宣科”的执行者
  • 典型:传统业务系统、操作系统内核

2. Software 2.0:人训模型(权重即程序)

  • Karpathy 2017 年提出:Software 2.0 = 神经网络权重zhihu.com
  • 人类不再写算法,而是设计数据集 + 目标函数,规则从训练里“长”出来
  • 典型:自动驾驶视觉模型、推荐模型

3. Software 3.0:人写 Prompt(LLM 即解释器)

Karpathy 在 2025 年的 YC 演讲里把话说得很绝philippdubach.com:

  • Software 3.0:人类写 Prompt,LLM 是解释器,上下文窗口就是程序philippdubach.com
  • 安装一个工具不再是写 Shell 脚本,而是:复制一段文本给 Agent,让它自己适配环境philippdubach.com+1
  • 编程单位从“函数”变成“段落 / 任务说明”

你的编程现在转向提示词(prompting)。上下文窗口里的内容,就是被 LLM 这个“解释器”执行的程序。philippdubach.com

这直接解释了为什么“Coding AGI”成为可能:
当程序 = Prompt + LLM,编程就变成“用自然语言指挥 Agent 在数字世界干活”,门槛骤降,范围暴涨。

三、从 Vibe Coding 到 Agentic Engineering:Coding AGI 的真正形态

1. Vibe Coding:门槛极低,但“碰运气”

Karpathy 自己造了Vibe Coding这个词,后来被柯林斯选为 2025 年度词汇sohu.com。他原话大意:

  • 一年前,LLM 还很弱,Vibe Coding 只能做玩具、Demo 和探索
  • 核心体验:你对着 AI 说一句,它吐一段代码,跑一下,不行就再试,有点“碰运气”tencent.com

2. Agentic Engineering:从“写提示词”到“指挥 Agent”

2026 年 2 月,Karpathy 亲自宣布:Vibe Coding 已死,未来叫 Agentic Engineeringtencent.com。

关键区别:

维度Vibe CodingAgentic Engineering
人的角色写提示词,一句句试架构师 + 审查者
AI 角色补全代码自主规划 + 执行 + 调试
交互方式一问一答下发任务,持续监控
质量控制碰运气系统化 Review + 测试
适用场景Demo、小工具生产级项目

他自己说得很直白:

‘agentic’ because the new default is that you are not writing the code directly 99% of the time, you are orchestrating agents who do and acting as oversight.tencent.com

这就是 Coding AGI 的真实形态:
不是“AI 完全取代程序员”,而是人类从“写代码”升级为“管理 Agent + 控制质量”

四、AGI 魔法真相:闭环尝试 + 声明式指令

很多人以为 AGI 的魔法是“AI 无所不知”,但 Karpathy 说:真正的魔法来自“闭环尝试”36kr.com。

1. 韧性(Tenacity):AI 最大的超能力

  • 人类被 Bug 卡 30 分钟就开始烦躁
  • AI 可以连续尝试 50 种方案,保持热情,直到目标达成36kr.com

这种“不断试错直到成功”的能力,在感官上非常接近人类的智慧,所以很多人才会有“AGI 体感”36kr.com。

2. 声明式指令:给“终点”,不给“路线图”

因为 AI 有韧性,我们的思维要从命令式 → 声明式36kr.com:

  • 命令式:
    • “先打开文件,再解析字符串,再过滤空格……”
    • 一步错,全盘崩
  • 声明式:
    • “我需要一个能处理这种 CSV 并输出图表的脚本,这是规格说明。”
    • 只定义“成功标准”,让 AI 自己找路线

给 AI 成功标准,而不是执行步骤,让它利用闭环尝试去撞开每一扇门36kr.com。

3. TDD + MCP:把韧性变成工程能力

Karpathy 给了两个实操建议36kr.com:

  1. 先写测试,再让 AI 写实现
    • 测试 = AI 的“监考老师”
    • 不通过就继续改,直到全部绿灯
  2. 把浏览器/数据库等能力通过 MCP 接进循环
    • Agent 写完代码,自动跑浏览器/数据库
    • 看到报错,再回到循环里继续修

这就是 Coding AGI 的工程化版本:
韧性 + 闭环 + 声明式目标 + TDD + MCP =可复用、可审查的 AGI 级编程能力

五、程序员怎么办:废用性萎缩 vs 10× 杠杆

1. 废用性萎缩:手写代码能力在退化

Karpathy 自己承认:

我已经明显感觉到,自己手写代码的能力在慢慢退化。36kr.com

  • 人类大脑中“判别”和“生成”是两种能力
  • 当你只负责判别,不负责生成,长期不用就会退化36kr.com

⚠️ 注意:如果 AI 撤下梯子,那些已经习惯漂浮在云端、失去攀爬能力的程序员,该怎么办?36kr.com

2. 10× 杠杆:顶尖工程师的收益更大

Karpathy 认为,Agentic Engineering 会放大顶尖工程师的价值

  • Vibe Coding:大家比“提示词技巧”,差距有限
  • Agentic Engineering:比的是架构能力、系统设计、品味和产品判断tencent.com

以前 10× 工程师是神话,现在通过 Agent,优秀程序员可以远超 10× 的杠杆philippdubach.com。

结论

  • 初级岗位:写代码的量级在收缩
  • 高级岗位:能设计系统、审查 Agent 的人更稀缺

六、实战指南:如何从 Vibe Coder 升级为 Agentic Engineer

1. 工作流升级示意

2. 三条马上能用的实战原则

  1. 先写“成功标准”,再写提示词

    • 不要从“第一步怎么做”开始,而是从“最后我要什么结果”开始
    • 把成功标准写成测试用例 / 验收条件
  2. 先写测试,再让 AI 写实现

    • 用 TDD 把 AI 的韧性变成工程能力
    • 测试通过 = 任务完成,人类只看结果
  3. 把工具链接进 Agent 循环

    • 用 MCP / 浏览器 / 数据库 / 监控,让 AI 能“看到结果”
    • 形成:目标 → 代码 → 执行 → 观察 → 修改 的闭环

七、避坑指南:Coding AGI 不是万能药

Karpathy 自己也很清醒,AI 编程有几个常见坑36kr.com:

  1. 乱假设 + 过度讨好

    • AI 会“脑补”错误假设,一路错下去,不问你
    • 解决:进入“计划模式”,让它先规划再执行
  2. 爱乱抽象、代码臃肿

    • 过度封装、死代码不清理
    • 解决:要求它“重构到 80 行以内”,或你自己做一轮 Review
  3. 别迷信“不用 IDE”

    • 重要代码,还是要用大屏 IDE 盯着 AI 输出
    • 你是“监工”,不是“甩手掌柜”

💡 秘籍:AI 编程的黄金法则是:你可以外包思考,但不能外包理解。philippdubach.com

结语:Coding AGI 不是未来,而是现在

Karpathy 的判断可以浓缩成三句:

  1. 2025 年 12 月,AI 编程发生质变,Coding Agent 从“玩具”变成“生产力工具”baai.ac.cn
  2. Vibe Coding → Agentic Engineering,人类从“写代码”变成“指挥 Agent + 审查结果”tencent.com
  3. Coding AGI 的魔法,来自闭环尝试 + 声明式指令 + 工程化约束,而不是“AI 全知全能”36kr.com

如果你还在把 AI 当“高级补全”,你已经在旧范式里;
如果你开始用 Agent 管理项目、用 TDD/MCP 约束它,你就是在和 Karpathy 同一个时代写代码。

Coding AGI 不是噱头,而是已经发生的现实。
问题是:你是在被它重塑,还是在假装什么都没发生?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/4 12:16:27

WR.DO实时数据分析功能:全球访问地图、实时日志与多维度统计

WR.DO实时数据分析功能:全球访问地图、实时日志与多维度统计 【免费下载链接】wr.do 一站式域名服务平台,集成短链生成、无限域名邮箱、文件存储和子域名管理,带有管理员面板,支持自部署 项目地址: https://gitcode.com/gh_mirr…

作者头像 李华
网站建设 2026/5/4 12:15:26

Bebas Neue开源项目:从字体选择困境到设计自由的三步破解法

Bebas Neue开源项目:从字体选择困境到设计自由的三步破解法 【免费下载链接】Bebas-Neue Bebas Neue font 项目地址: https://gitcode.com/gh_mirrors/be/Bebas-Neue 开篇:为什么你的设计总是缺少视觉冲击力? 你是否遇到过这样的困境…

作者头像 李华
网站建设 2026/5/4 12:10:38

暗黑破坏神2存档修改终极指南:d2s-editor完全使用手册

暗黑破坏神2存档修改终极指南:d2s-editor完全使用手册 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 你是否厌倦了在暗黑破坏神2中反复刷装备的无尽循环?是否想要快速测试不同的角色build却受限于等级&a…

作者头像 李华
网站建设 2026/5/4 12:03:39

R3nzSkin国服换肤工具完整指南:零风险解锁英雄联盟全皮肤体验

R3nzSkin国服换肤工具完整指南:零风险解锁英雄联盟全皮肤体验 【免费下载链接】R3nzSkin-For-China-Server Skin changer for League of Legends (LOL) 项目地址: https://gitcode.com/gh_mirrors/r3/R3nzSkin-For-China-Server 你是否曾羡慕别人拥有的稀有英…

作者头像 李华
网站建设 2026/5/4 12:03:28

内容创作场景下如何利用Taotoken多模型能力优化文案生成效果

内容创作场景下如何利用Taotoken多模型能力优化文案生成效果 1. 多模型选型在内容创作中的价值 内容创作者在日常工作中需要应对多种文案风格需求,从社交媒体短文到深度行业分析,不同场景对语言风格、知识广度和创意水平的要求差异显著。传统单一模型方…

作者头像 李华