
邮箱|zhouyixiao@pingwest.com
有开发者用中文问Claude Opus 4.8“你是什么模型”,API返回的字段写着claude-opus-4.8,输出却回答“我是通义千问”。换个人问,又变成“我是DeepSeek”。截图在X上传了一轮,谁学了谁,在这个行业里本来就说不太清楚。

说不清楚归说不清楚,Anthropic最近可是认真了。彭博这两天先捅出一封信,收件人是参议院银行委员会的两位负责人。信里说阿里的关联方用了约2.5万个虚假账号,跟Claude跑了近2880万次对话,Anthropic把这定性为“工业级的蒸馏攻击”,直接挂上了国家安全。
舆论明显偏向质疑。科技博主Evrim Kanbur在X上的一段话被大量转发,“多年来,逆向工程、基准测试、研究竞争对手,这些一直被叫做竞争。现在Qwen开始在软件工程基准上领先了,话题突然就从性能变成了指控。如果你在别人发布更强模型时的第一反应是找律师,人们自然会怀疑,真正的问题到底在排行榜上还是别的什么地方。”IO.Net联合创始人Tory Green更不客气,“你用开放互联网的内容训练模型,别人来学你的时候就叫蒸馏攻击。”

对一家把“安全”当品牌核心的公司来说,这样的舆论场面多少有些难堪。但往回看Anthropic这一年半的操作,眼前这一幕不太像意外,倒更像是一套越来越顺手的固定动作。
一份没打算让开发者看的“投名状”
阿里不是头一个被点名的。早在去年DeepSeek R1发布后,CEO达里奥就在博文里夹了一句“本文不就西方模型被蒸馏的报道表态”,所有人都读懂了潜台词。今年2月直接摊牌,点名指控DeepSeek、月之暗面、MiniMax三家蒸馏了Claude。这回轮到阿里,名单一路点下来,《纽约时报》已经在猜下一个是不是智谱。

这封信的操作方式也值得留意。Anthropic没有公开发布它,甚至没有像2月那次一样写篇博文,是媒体捅出来之后大家才看到的。一家公司如果真遇到了大规模的服务条款违规,正常做法是切掉账号、固定证据,然后走法律程序,或者至少通过正常的商业渠道跟对方沟通。但Anthropic没打官司,没有正式交涉,反倒悄悄给参议员写了封信,措辞从“违反服务条款”一路拔到“国家安全威胁”。想解决问题有很多种办法,选这一种,说明它想解决的并不是蒸馏本身。
蒸馏这事也没有Anthropic渲染得那么邪乎。Ai2后训练研究负责人、开源模型OLMo的核心作者Nathan Lambert早在5月就发过一篇《蒸馏恐慌》,他的核心观点是,如果有人用假账号滥用API,那是手段的问题,该追究的是违规行为本身。但Anthropic故意把滥用手段和蒸馏技术捆在一起叫“蒸馏攻击”,效果就是把一桩商业纠纷包装成了技术层面的国家安全威胁。
蒸馏是2015年诺奖得主Hinton提出的基础训练技术,全行业都在用。Musk今年4月在法庭上被问到xAI有没有蒸馏OpenAI,回了一个“Partly”(部分如此),还表示这在行业内属于普遍做法。英伟达的Nemotron系列公开的训练数据里大量使用了中国开源模型。DeepSeek发布R1时在论文里白纸黑字写了,它基于Qwen蒸馏了4个不同尺寸的模型,全部MIT协议开源。蒸馏也没那么玄乎,Baseten的模型负责人Charles O'Neill说过,单靠蒸馏造不出一流模型,“外界普遍认为这些模型的所有能力都源自Anthropic,但事实并非如此”。模型真正的能力来自强化学习和工程积累,蒸馏能抄到一些输出的模式,但远远不够。

Anthropic到底在喊什么
那Anthropic每次把蒸馏喊成“国家安全”的时候,究竟在喊什么?
Anthropic跟华盛顿的关系,这半年僵得厉害。去年中旬Claude还是第一个接入美军涉密网络的前沿模型。但今年2月底,双方在AI军事用途的红线问题上谈崩了,达里奥坚持Claude不能用于大规模监控和全自主武器,五角大楼要求不设限制。最终谈判破裂,特朗普下令联邦机构停用Anthropic产品,国防部长把它列为“供应链风险”,2亿美元的国防合同破裂,OpenAI随即接了盘。
而就在同一周内,Anthropic发出了指控三家中国公司蒸馏Claude的博文。
到了5月,五角大楼一口气跟八家公司签了涉密AI合同,SpaceX、OpenAI、Google、微软、英伟达全在列,Anthropic被排除在外。6月初它递了IPO文件,Series H估值9650亿美元,目标是上市时突破万亿。可跟华盛顿的关系从2月起就没真正修复过。在这个节骨眼上给参议院递一份“中国AI公司大规模窃取美国AI能力”的材料,客观效果很清楚,它在向华盛顿证明自己站对了队。信捅出来两周之后,参议员Bill Hagerty和Andy Kim已经在推进国防法案修正案,要对“不当获取美国AI模型输出”的实体实施制裁。从一封信到立法动议,这个转化效率,或许正是Anthropic想要的。
两头夹着的焦虑
政治层面的拉锯只是Anthropic焦虑的一面,另一面在生意本身。
Anthropic讲的一直是一个“技术溢价”的故事,靠巨额算力和研发投入做最强的模型,再靠领先优势卖出高价。这个故事的前提是它得一直领先。但中国的模型阵营在过去半年进步飞快,DeepSeek V4、GLM-5.2等开源模型在编程和Agent评测中频频逼近Claude,阿里的Qwen3.7-Max在多项基准上同样表现强劲,而这些模型的API定价普遍只有Anthropic的几分之一。如果对手用零头的成本就能干到八九成的活,“技术溢价”的故事就很难继续讲下去。

与此同时,Anthropic一贯的“安全牌”也在反噬自己。它从4月起就反复渲染Mythos模型在发现网络漏洞方面有多强大,Fable 5作为消费版发布时更把安全防护当核心卖点。本意是抬身价,结果6月商务部真下了出口禁令,Fable 5和Mythos 5全球下线,连自己的非美国籍员工都用不了。网络安全研究员Peter Girnus在X上的评论被大量转发,如果你在每篇新闻稿里都把自己的产品描述成军火,最终政府会照你说的做。
但Anthropic并没有因此放弃安全叙事。Fable/Mythos那张牌打的是“我们的模型太强了,需要管控”,结果让自己成了被管控的对象。蒸馏指控这张牌方向正好相反。Anthropic在2月那篇指控三家中国公司的博文里写得很明白,“这些实验室的快速进步会被错误地当成出口管制无效的证据,但实际上,这些进步在很大程度上依赖于从美国模型中提取的能力。”翻译一下就是,中国AI追上来了,不是管制没用,是它们偷了我们的东西。前一张牌让自己成了管控对象,后一张牌让自己变成需要保护的受害者。吃了前一张的亏,后一张就更不能停。
选择性的正义感
选择性的正义感,也算是Anthropic的老习惯了。
它训练Claude时从盗版网站下载了700万本书,去年同意以15亿美元和解,是美国史上最大的版权和解案。李开复发现自己的书也在其中,在微博上调侃说Anthropic至今还欠他3000美元稿费。The Pragmatic Engineer作者、知名开发者博主Gergely Orosz的评价更直接,“Anthropic不能两头占便宜,别忘了它自己是怎么训练Claude的,用版权书籍,被告了之后才付钱给版权持有者。”

用盗版书喂自己的模型,同意以15亿和解了事。别人花钱调它的API来学习,反倒成了“明目张胆的非法窃取”。开发者社区流传最广的一张meme,一句话概括了这种观感,“你做的时候叫蒸馏,我们做的时候叫训练。”
这套操作的后果也已经在扩散。OpenAI新模型的发布流程正在变化,需要先向符合条件的B端客户推送,经政府逐一审核后才能上线。AI模型正在从一个正常的互联网产品,变成类似战略资产的东西,谁能用、谁不能用,开始变成一个需要政府点头的问题。
Anthropic把“国家安全”喊得越响,越藏不住自己被两头夹着的处境。万亿估值的IPO在即,最强产品被封,被排除在军方AI合同之外,对手追到了身后。一家拿全行业都在用的技术做文章的公司,与其说是真觉得蒸馏有多大威胁,不如说是需要一个能同时向华盛顿表忠心、向市场讲故事的工具。与此同时,对面的开源模型还在继续发布,价格还在继续往下打。

