news 2026/7/2 19:07:25

Meta限制使用Claude Code和Codex:防「蒸馏陷阱」,省钱又避雷?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Meta限制使用Claude Code和Codex:防「蒸馏陷阱」,省钱又避雷?

Meta划出红线

今年5月,Meta给自家工程师划了一道红线,应用AI工程部门的人不能再随便用Claude Code和Codex了。据The Information拿到的内部指南,一份备忘录甚至直接要求,暂停某些用到这两个模型的任务,文件措辞很重,说这可能触发「与合作方的严重升级」。然而,Meta是Claude Code在全球最大的客户之一,它今年内部用AI的总账单正奔着数十亿美元去。天天离不开的工具,公司花大钱买来,现在却在内部限制使用,而限制的理由是它们太好用了。这条红线至今仍在生效,据The Information报道,这套限制5月就定下,一直持续到现在。

自研项目引发的担忧

Meta为何如此紧张?这要从它内部一个AI编程助手项目说起。今年,它组建了一个应用AI工程团队,主攻自研的AI编程助手MetaCode(原名DevMate),目标是不再花大价钱使用别人的AI编程模型,自己训一个出来。可要练出一个会写代码的模型并不简单,需要喂给它海量高质量数据,还得出足够多、足够刁钻的编程题,让它练手、给它判分,这套题库和评测几乎决定了一个编程模型最终有多强。但Meta遇到的难题是,怎样才能不让员工太过依赖这些外部工具,去打造内部的替代品。它担心这些外部模型的输出渗进训练数据,让自己造的模型偷偷学了对手的本事。因为一个模型是「学」它所被喂的数据,MetaCode想变强靠的是工程师攒的训练数据和编程题库,若这些题目、答案、判分标准出自Claude或Codex,MetaCode学到的就是「Claude的本事」,会照着对手的卷子抄答案。更隐蔽的是评测环节,如果出题和判分都交给Codex,MetaCode就会朝着「Codex觉得对」的方向进化,把对手的判断标准复刻进自己脑子里。所以,Meta的指南不让AI当出题人、判卷人,连「AI生成的材料能不能进被测模型读得到的环境」都要管,目的是给训练数据做隔离,怕分不清哪些本事是自己训练出来的,哪些是从Claude和Codex那儿学来的。

细到让人意外的限制

Meta的内部文件里并没有员工真违规的记录,Meta发言人也回应公司有「明确的政策」规范怎么用AI工具,所以这份文件更像是在内部提前拉响警报。哪些活不能让AI碰呢?主要有以下三类:第一,不能拿Claude或Codex的输出去给自家模型出测试题,指南称这「明确属于工程师不在驾驶位的范畴」,「我们不要源自模型的任务」;第二,不能让AI在源码里找bug,也不能让它基于代码分析帮你想「该测什么」;第三,AI生成的任何东西都不能放进被测模型能访问到的地方。只要AI参与了「该测什么、答得对不对」的判断,对手的本事就可能混进来。而哪些活还能让AI干呢?搭工作流、整理代码和文件、给内部工具搭测试的架子等日常杂活可以,指南把这类工作称作「测试脚手架(test scaffolding)」和「方案校准(solution calibration)」,也就是打下手、搭框架。哪怕是这些活,也有一条铁律:AI的每一行产出,人都得先过一遍眼。Meta真正想守住的是「谁教会了谁」的界线。

绕不开的「蒸馏陷阱」

Meta担心的这件事,业内有个专门名词叫「蒸馏(distillation)」,意思是拿一个更强的模型不停答题,再用这些答案去训练一个较弱的模型,有点像让学霸把卷子从头做一遍,学渣照着抄。从零训一个前沿模型,烧的钱和时间是天文数字,而蒸馏可能只要对方一批输出,成本和工期都砍到零头。蒸馏本身是业界常规操作,大厂也常拿自家大模型蒸馏出更小、更便宜的版本给用户用。但麻烦在于,一旦抄的是别人家的模型,就说不清训出来的能力到底是自己练的还是顺来的,有人把这叫「蒸馏陷阱」,越是靠最强的模型去搭自己的地基,就越难证明自己的聪明从哪来。在美国,法律并未明文禁止蒸馏,AI生成的内容也不受版权保护,拿对方的输出去练自己的模型,法律基本拦不住,唯一的关卡是合同。OpenAI、Anthropic的服务条款都写了类似的限制:不许拿模型的输出去造一个跟自己竞争的东西,而且这道关卡的执法权全在竞争对手手里。去年,Anthropic就直接掐断了OpenAI对Claude的接口(API)访问,哪怕OpenAI说自己只是拿来评测能力和安全性,是「行业标准」做法。就连马斯克,也在今年4月的一场庭审上被迫承认,他的xAI「部分」蒸馏过OpenAI的模型。2026年4月30日,在加州联邦法院的证人席上,马斯克被问到xAI是否对OpenAI模型用了蒸馏技术来训练Grok,他先称这是AI公司的普遍做法,当被追问这是否等于「是」时,他回答是「部分」。规则模糊,「执法权」都攥在竞争对手手里,谁敢拿自己几十亿的投入去赌对手不翻脸。从这个角度看,Meta的紧张并不多余。这里还有一个算盘就是省钱,按内部备忘录,Meta今年光内部用AI这一项就要烧掉数十亿美元,它甚至开始给员工的token用量设上限。如果能把开发工作从昂贵的外部工具转到自家MetaCode上,既省了钱,又躲开了蒸馏的雷,可谓一举两得。

一张走钢丝的地图

科技法学者、法律顾问Mark Leiser形容Meta这套内部文件「几乎就是一张走钢丝的地图」,一边要获得外部模型的好处,一边又得防着它的本事溜进自家系统。像这样走钢丝的不止Meta一家公司,它戳中的是整个行业的命门。当用一个足够聪明的AI去造另一个同样聪明的AI,到最后可能很难说清这份聪明究竟是自己练出来的还是从别人的AI那儿悄悄学来的。而且这事离普通人也没那么远,用AI写的代码、改的方案、攒的资料,喂回去又会变成下一代模型的养料,在这个循环中,谁站在谁的肩膀上,那条界线已经变得越来越糊。当AI开始帮我们造AI,我们还分得清本事到底是谁的吗?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/2 19:05:07

GraphRAG 实战:知识图谱和 RAG 结合起来,用排错清单压住复杂度

聊《GraphRAG 实战:知识图谱和 RAG 结合起来,用排错清单压住复杂度》之前,先说一句实在的:别急着背概念,先看它在真实项目里到底解决什么问题。摘要这篇面向需要构建企业知识库和复杂问答系统的开发者,但不…

作者头像 李华
网站建设 2026/7/2 19:03:49

独家实测:2026年适合中小制造/零售/服务业的3种企业AI全案解决方案,哪种变现路径最短?

企业AI全案落地实战:3种主流方案的变现效率深度拆解你好,我是阿九。如果你是一位正在考虑引入 企业AI全案解决方案 的中小企业主或技术负责人,你很可能正被市面上五花八门的概念弄得晕头转向。你最大的困惑或许是:这些方案听起来都…

作者头像 李华
网站建设 2026/7/2 19:03:21

LLM生成参数深度解析:temperature、top-p、top-k与max_tokens实战指南

1. 为什么这四个参数是LLM应用开发的“方向盘”,而不是可有可无的开关 你有没有遇到过这样的情况:同一个提示词,昨天生成的代码逻辑清晰、变量命名规范,今天跑出来的却满屏 temp_var1 、 data_2 ,还多了一个根本没…

作者头像 李华
网站建设 2026/7/2 19:01:55

Cursor 3.0 把编辑器拆成 Agent 面板,谁来管 Spring Boot 工程的质量?

6 月 19 日,Cursor 3.0 正式上线。这并非一次普通的版本更新——Cursor 3.0 彻底重构了 IDE,将主面板让位于一组并行 Agent 的编排面板。官方说法是:这是“为一个所有代码都由 Agent 编写的世界”而生的工具。打开 Cursor 3.0,输入…

作者头像 李华
网站建设 2026/7/2 19:01:26

V 语言:一门周末就能学会的编程语言

文章目录V 语言:一门周末就能学会的编程语言它能干什么为什么有人选它它能做到什么程度安装稳定性和未来适合谁V 语言:一门周末就能学会的编程语言 V 语言在 GitHub 上已经拿到 37,658 Star。 这门语言的定位很明确:像 Go 一样简单&#xf…

作者头像 李华
网站建设 2026/7/2 19:01:04

Ubuntu 18.04 搭建高可用 Docker 私有仓库实战

1. 项目概述:为什么要在 Ubuntu 18.04 上自建 Docker 私有仓库?Docker 私有仓库不是“可有可无”的附加功能,而是生产环境落地的刚性门槛。我最早在 2017 年给一家做智能硬件的初创公司做 CI/CD 架构时就踩过这个坑——当时所有镜像都推到 Do…

作者头像 李华