Meta划出红线
今年5月,Meta给自家工程师划了一道红线,应用AI工程部门的人不能再随便用Claude Code和Codex了。据The Information拿到的内部指南,一份备忘录甚至直接要求,暂停某些用到这两个模型的任务,文件措辞很重,说这可能触发「与合作方的严重升级」。然而,Meta是Claude Code在全球最大的客户之一,它今年内部用AI的总账单正奔着数十亿美元去。天天离不开的工具,公司花大钱买来,现在却在内部限制使用,而限制的理由是它们太好用了。这条红线至今仍在生效,据The Information报道,这套限制5月就定下,一直持续到现在。
自研项目引发的担忧
Meta为何如此紧张?这要从它内部一个AI编程助手项目说起。今年,它组建了一个应用AI工程团队,主攻自研的AI编程助手MetaCode(原名DevMate),目标是不再花大价钱使用别人的AI编程模型,自己训一个出来。可要练出一个会写代码的模型并不简单,需要喂给它海量高质量数据,还得出足够多、足够刁钻的编程题,让它练手、给它判分,这套题库和评测几乎决定了一个编程模型最终有多强。但Meta遇到的难题是,怎样才能不让员工太过依赖这些外部工具,去打造内部的替代品。它担心这些外部模型的输出渗进训练数据,让自己造的模型偷偷学了对手的本事。因为一个模型是「学」它所被喂的数据,MetaCode想变强靠的是工程师攒的训练数据和编程题库,若这些题目、答案、判分标准出自Claude或Codex,MetaCode学到的就是「Claude的本事」,会照着对手的卷子抄答案。更隐蔽的是评测环节,如果出题和判分都交给Codex,MetaCode就会朝着「Codex觉得对」的方向进化,把对手的判断标准复刻进自己脑子里。所以,Meta的指南不让AI当出题人、判卷人,连「AI生成的材料能不能进被测模型读得到的环境」都要管,目的是给训练数据做隔离,怕分不清哪些本事是自己训练出来的,哪些是从Claude和Codex那儿学来的。
细到让人意外的限制
Meta的内部文件里并没有员工真违规的记录,Meta发言人也回应公司有「明确的政策」规范怎么用AI工具,所以这份文件更像是在内部提前拉响警报。哪些活不能让AI碰呢?主要有以下三类:第一,不能拿Claude或Codex的输出去给自家模型出测试题,指南称这「明确属于工程师不在驾驶位的范畴」,「我们不要源自模型的任务」;第二,不能让AI在源码里找bug,也不能让它基于代码分析帮你想「该测什么」;第三,AI生成的任何东西都不能放进被测模型能访问到的地方。只要AI参与了「该测什么、答得对不对」的判断,对手的本事就可能混进来。而哪些活还能让AI干呢?搭工作流、整理代码和文件、给内部工具搭测试的架子等日常杂活可以,指南把这类工作称作「测试脚手架(test scaffolding)」和「方案校准(solution calibration)」,也就是打下手、搭框架。哪怕是这些活,也有一条铁律:AI的每一行产出,人都得先过一遍眼。Meta真正想守住的是「谁教会了谁」的界线。
绕不开的「蒸馏陷阱」
Meta担心的这件事,业内有个专门名词叫「蒸馏(distillation)」,意思是拿一个更强的模型不停答题,再用这些答案去训练一个较弱的模型,有点像让学霸把卷子从头做一遍,学渣照着抄。从零训一个前沿模型,烧的钱和时间是天文数字,而蒸馏可能只要对方一批输出,成本和工期都砍到零头。蒸馏本身是业界常规操作,大厂也常拿自家大模型蒸馏出更小、更便宜的版本给用户用。但麻烦在于,一旦抄的是别人家的模型,就说不清训出来的能力到底是自己练的还是顺来的,有人把这叫「蒸馏陷阱」,越是靠最强的模型去搭自己的地基,就越难证明自己的聪明从哪来。在美国,法律并未明文禁止蒸馏,AI生成的内容也不受版权保护,拿对方的输出去练自己的模型,法律基本拦不住,唯一的关卡是合同。OpenAI、Anthropic的服务条款都写了类似的限制:不许拿模型的输出去造一个跟自己竞争的东西,而且这道关卡的执法权全在竞争对手手里。去年,Anthropic就直接掐断了OpenAI对Claude的接口(API)访问,哪怕OpenAI说自己只是拿来评测能力和安全性,是「行业标准」做法。就连马斯克,也在今年4月的一场庭审上被迫承认,他的xAI「部分」蒸馏过OpenAI的模型。2026年4月30日,在加州联邦法院的证人席上,马斯克被问到xAI是否对OpenAI模型用了蒸馏技术来训练Grok,他先称这是AI公司的普遍做法,当被追问这是否等于「是」时,他回答是「部分」。规则模糊,「执法权」都攥在竞争对手手里,谁敢拿自己几十亿的投入去赌对手不翻脸。从这个角度看,Meta的紧张并不多余。这里还有一个算盘就是省钱,按内部备忘录,Meta今年光内部用AI这一项就要烧掉数十亿美元,它甚至开始给员工的token用量设上限。如果能把开发工作从昂贵的外部工具转到自家MetaCode上,既省了钱,又躲开了蒸馏的雷,可谓一举两得。
一张走钢丝的地图
科技法学者、法律顾问Mark Leiser形容Meta这套内部文件「几乎就是一张走钢丝的地图」,一边要获得外部模型的好处,一边又得防着它的本事溜进自家系统。像这样走钢丝的不止Meta一家公司,它戳中的是整个行业的命门。当用一个足够聪明的AI去造另一个同样聪明的AI,到最后可能很难说清这份聪明究竟是自己练出来的还是从别人的AI那儿悄悄学来的。而且这事离普通人也没那么远,用AI写的代码、改的方案、攒的资料,喂回去又会变成下一代模型的养料,在这个循环中,谁站在谁的肩膀上,那条界线已经变得越来越糊。当AI开始帮我们造AI,我们还分得清本事到底是谁的吗?