前 OpenAI 联合创始人 Andrej Karpathy：过去几周使用 Claude Code 的一些真实体会-洪萨配资

Andrej Karpathy是全球 AI 顶尖专家，OpenAI 创始成员，曾任 Tesla AI 总监领导 Autopilot 研发。他师从李飞飞，创办了斯坦福 CS231n 课程，并在 2024 年成立 Eureka Labs 投身 AI 教育。作为硬核开发者，他擅长将复杂技术深入浅出地拆解，是连接顶层研究与工程实践的灵魂人物。

2025 年末编程范式转移：从“手动挡”到“代理驾驶”

过去几周，深度使用 Claude 编程让我产生了一些零散但深刻的感悟。

1. 工作流的剧变：从 80% 手动到 80% 代理

随着 LLM 编程能力的再次飞跃，我的工作流在短短几周内发生了翻天覆地的变化：

11月：80% 手动/补全 + 20% Agent 协作。
12月：80% Agent 编程 + 20% 人工微调。

我现在几乎是在用英语编程——略带羞愧地用文字“指挥”LLM 写代码。虽然这有点伤自尊，但在软件开发中以“大型代码动作 (Large Code Actions)”为单位进行操作的效率实在太高了。这是我 20 年编程生涯中最剧烈的一次工作流变革。

2. 现实检查：IDE 仍不可或缺，Agent 并非万能

尽管“Agent 集群”呼声很高，但我认为目前的某些吹捧过头了：

脆弱性：模型依然会犯错，且错误从“语法错误”转向了“隐蔽的逻辑错误”。它们像是一个手脚麻利但粗心大意的大三实习生。
自以为是：Agent 常会在不确认的情况下替你做错误假设，且不擅长管理混乱、不寻求澄清、不主动暴露不一致性，表现得过于讨好（Sycophantic）。
代码膨胀：它们倾向于把 API 和架构搞复杂。有时会为了一个简单功能写 1000 行脆弱的代码，直到你反问：“不能直接这样写吗？”它们才恍然大悟缩减到 100 行。
最佳实践：建议左屏开启终端（如 Ghostty）跑 Agent Session，右屏开启大型 IDE 像鹰一样盯着代码库，随时进行人工干预。

3. 核心优势：坚韧性 (Tenacity) 与杠杆 (Leverage)

耐力瓶颈的突破：Agent 从不疲倦或沮丧。看着它为一个难题折腾 30 分钟最终获胜，是一种“感受到 AGI”的时刻。体力/意志力不再是工作的瓶颈。
从指令到声明：不要告诉它“怎么做”，要给它“成功标准”。
先写测试，再让它通过测试。
配合浏览器 MCP（Model Context Protocol）使用。
声明式编程：改变你的思维方式，从“过程式指令”转为“声明式目标”，让 Agent 自行循环尝试。

4. 速度与能力的双重扩张

AI 带来的不仅仅是“加速”，更是“扩张”：

边际成本降低：以前觉得“不值得写”的工具或功能，现在随手就能实现。
打破技能边界：以前因为知识储备或技术栈限制而不敢碰的代码领域，现在可以轻松介入。

深度反思：工程师的未来

编程是变有趣了还是枯燥了？

我认为编程变得更有趣了，因为填补空白的琐碎体力活消失了，剩下的全是创造性部分。

暴论：LLM 编程将分化工程师群体——那些热衷于“写代码”的人可能会感到失落，而那些热衷于“构建产品”的人将如鱼得水。

技能萎缩与“屎山”危机

能力退化：我发现自己的手动编码能力正在退化。“生成（写）”和“判别（读）”是不同的脑部功能，我们可以像顶级评论员一样审阅代码，但手感正在变生。
Slopacolypse（垃圾信息末日）：预感 2026 年将是数字内容的“崩坏之年”。GitHub、Substack、arXiv 将充斥着大量 AI 生成的平庸内容（Slop），生产力幻觉将与真实的进步并存。

待思考的问题

10倍程序员：顶尖与平庸程序员的产出比是否会从 10 倍拉大到 100 倍？
全才 vs 专才：既然 LLM 擅长微观执行，通才是否会凭借宏观战略能力彻底碾压专才？
未来感：未来的编程更像是玩《星际争霸》、《异星工厂》还是在演奏乐器？

总结：2025 年 12 月是一个分水岭，LLM Agent 的连贯性跨越了某个临界点。现在的逻辑能力（Intelligence）已经远超现有的工具集成和组织流程。2026 年将是全行业消化、吸收这一新能力的“高能时刻”。

原文：https://x.com/karpathy/status/2015883857489522876^[1]

参考阅读：

Clawdbot 评测：梦寐以求的 AI 助手，但你可能还不该用它
扩展 PostgreSQL，以支撑 8 亿 ChatGPT 用户
无限代码危机！奈飞AI工程师曝自家上下文工程秘诀：三阶段方法论！AI不能理解软件为什么会失败！每一代工程师都会撞上一堵墙！

References

https://x.com/karpathy/status/2015883857489522876

前 OpenAI 联合创始人 Andrej Karpathy：过去几周使用 Claude Code 的一些真实体会

2025 年末编程范式转移：从“手动挡”到“代理驾驶”

1. 工作流的剧变：从 80% 手动到 80% 代理

2. 现实检查：IDE 仍不可或缺，Agent 并非万能

3. 核心优势：坚韧性 (Tenacity) 与杠杆 (Leverage)

4. 速度与能力的双重扩张

深度反思：工程师的未来

编程是变有趣了还是枯燥了？

技能萎缩与“屎山”危机

待思考的问题

参考阅读：

References

小白也能懂的语音识别：Fun-ASR保姆级使用教程

超实用零基础创意生日祝福网页制作指南

BGE-M3实战入门：curl命令行调用、Postman配置、Swagger接口文档生成

STM32 OTG音频设备应用项目实战

XInputTest控制器性能检测工具全面解析与实战指南

2分钟部署VibeThinker-1.5B：开发者实测推荐镜像方案

2025 年末编程范式转移：从“手动挡”到“代理驾驶”

1. 工作流的剧变：从 80% 手动到 80% 代理

2. 现实检查：IDE 仍不可或缺，Agent 并非万能

3. 核心优势：坚韧性 (Tenacity) 与 杠杆 (Leverage)

4. 速度与能力的双重扩张

深度反思：工程师的未来

编程是变有趣了还是枯燥了？

技能萎缩与“屎山”危机

待思考的问题

参考阅读：

References

小白也能懂的语音识别：Fun-ASR保姆级使用教程

超实用零基础创意生日祝福网页制作指南

BGE-M3实战入门：curl命令行调用、Postman配置、Swagger接口文档生成

STM32 OTG音频设备应用项目实战

XInputTest控制器性能检测工具全面解析与实战指南

2分钟部署VibeThinker-1.5B：开发者实测推荐镜像方案

3. 核心优势：坚韧性 (Tenacity) 与杠杆 (Leverage)