Anthropic联合创始人：AI递归自我改进2028年底前有60%概率发生，行业加速迈向自动化！-洪萨配资

四年，从30秒到12小时

Clark的核心论据是一批能力进展曲线。METR是专注AI能力评估的机构，追踪AI系统独立完成任务在50%成功率水平线上，熟练人员完成该任务所需时间。2022年，GPT - 3.5需30秒；2023年，GPT - 4推到4分钟；2024年，o1到40分钟；2025年，GPT - 5.2（高配版）达6小时；2026年，Claude Opus 4.6到12小时，四年翻了1440倍！AI能力研究员Ajeya Cotra认为，2026年底前该数字有望突破100小时，达到后能覆盖许多多日级软件/研究辅助任务。

编程能力同样也在起飞

SWE - Bench衡量AI解决真实GitHub工程问题的能力，2023年底Claude 2得分2%，今年Claude Mythos Preview达93.9%，基本打穿基准。CORE - Bench测试AI独立复现论文实验结果的能力，2024年9月推出时最好成绩21.5%，2025年12月Opus 4.5在Claude Code scaffold下verified accuracy为77.78%，人工校验后为95.5%，项目方称已解决。MLE - Bench测AI独立参加Kaggle竞赛能力，覆盖75个真实比赛项目，2024年10月发布时最高分16.9%，2026年2月Gemini 3加搜索工具组合达64.4%。Anthropic内部测试让模型优化仅使用CPU的小型语言模型训练代码，2025年5月Claude Opus 4为2.9倍；2025年11月Opus 4.5为16.5倍；2026年2月Opus 4.6为30倍；2026年4月Claude Mythos Preview为52倍，不到一年从2.9倍涨到52倍。

99%的工程活，AI快接完了

AI研究中纯工程与真正创意占比是关键问题，Clark引用爱迪生名言，认为AI研究也是1%灵感和99%汗水。典型AI研究循环中，大部分工作如数据清洗、跑实验等是“汗水”。偶尔有Transformer架构、混合专家模型（MoE）等改变范式的发明，但只占1%且非瓶颈，99%工程工作正被AI快速接管。AI已能管理其他AI，Claude Code、OpenCode里单个AI可扮演“项目经理”。PostTrainBench测试AI微调开源小模型提升表现的能力，截至2026年3月，AI系统能达人类研究员效果一半左右，约25% - 28%提升幅度，人类基线是51%。Anthropic内部“自动化对齐研究”概念验证中，AI给出方案超人类研究员基线。Clark判断AI已能自动化AI工程绝大部分。

质疑声也来了

Clark帖子发出后行业有质疑。华盛顿大学机器学习教授、《终极算法》作者Pedro Domingos称从LISP在50年代发明以来AI就能构建自己，但过程收益存疑。有人质疑RSI概念边界，@crepesupreme指出2027 - 2028年概率跳升30个百分点意味着有不连续能力事件。Clark回应AI研究需创意突破才能进入“自我研发”循环，这是2027年概率低的原因，若2028年底前缺口补上概率升为60%，他强调预判的是概率而非确切时间点。还有人问为何用公开数据，Clark称公开数据有可信度，要的是可独立核验的结论。

窗口还开着，但在缩窄

Clark认为不给2027年更高概率是因AI研究对创意直觉有要求，目前只有“诱人的早期信号”，无系统性突破。他列举Gemini模型攻克Erdős数学问题和AI在发现新数学证明中的作用为早期信号。若2028年底未出现他描述的情况，说明当前技术路径有能力天花板，需人类创意突破。Anthropic在2026年3月宣布成立The Anthropic Institute时提出AI递归自我改进发生后的告知和治理问题，自身也无完整答案。Clark还给出对齐技术准确率随递归迭代下降的担忧，认为治理窗口有限且在缩窄。据奥特曼直播及媒体报道，OpenAI目标是2026年9月前让AI达“AI研究实习生”水平，2028年达更完整自动化研究员；Anthropic发表自动化对齐研究概念验证；Recursive Superintelligence完成5亿美元融资，目标之一是自动化AI研究，行业正朝此方向加速。

入门总结：计算机视觉基础知识点梳理与常见问题解答

入门总结：计算机视觉基础知识点梳理与常见问题解答📚 本章学习目标：深入理解计算机视觉基础知识点梳理与常见问题解答的核心概念与实践方法，掌握关键技术要点，了解实际应用场景与最佳实践。本文属于《计算机视觉教程》…

李华

【芯片Partition设计全解析：从后端实现到Chiplet系统架构】

导读：当单颗芯片突破百亿晶体管、面积逼近光刻极限，“大芯片"时代的设计方法论正在发生深刻变革。Partition技术从最初的后端实现手段，演进为支撑Chiplet异构集成的系统级架构设计哲学。本文将深入解析Partition的四大维度——后端物理、…

李华

别再只看排行榜了！手把手教你用MMLU基准实测大模型（附Zero-Shot/Few-Shot代码） 当你在各大AI社区看到LLM排行榜时，是否曾怀疑过这些数字背后的真实含义？上个月，我们团队复现某知名开源模型的MMLU评估时&…

李华

ColabFold完全指南：如何用免费GPU在30分钟内预测蛋白质三维结构

ColabFold完全指南：如何用免费GPU在30分钟内预测蛋白质三维结构【免费下载链接】ColabFold Making Protein folding accessible to all! 项目地址: https://gitcode.com/gh_mirrors/co/ColabFold 蛋白质结构预测是理解生命机制的关键，但传统方法…

李华

Odoo 17本地开发环境搭建避坑指南：Docker版 vs 源码版怎么选？

Odoo 17本地开发环境搭建避坑指南：Docker版 vs 源码版怎么选？ 第一次接触Odoo开发的新手，往往会在环境搭建这一步卡壳。面对Docker的一键部署和源码安装的灵活可控，到底哪种方式更适合你的项目？这篇文章将从实际开发场…

李华

YOLO26-seg分割优化：原创自研 | 自研独家创新DSAM注意力，基于BiLevelRoutingAttention注意力升级

💡💡💡本文原创自研改进：提出新颖的注意力DSAM（Deformable Bi-level Spatial Attention Module），创新度极佳，适合科研创新，效果秒杀CBAM，Channel Attention+Spartial Attention升级为新颖的 Deformable Bi-level Attention+Spartial Attention 💡💡💡BRA…

李华