
2月24日,Anthropic在其官网发文,指控三家中国人工智能企业,通过大量虚假账号对其Claude模型进行 “模型蒸馏”,以优化自身产品。
涉事方包括DeepSeek、Moonshot和MiniMax。这些企业被指注册了超过2.4万个虚假账户,与Claude产生了1600 万次以上交互,重点针对推理能力、工具使用与代码能力进行学习。
Anthropic表示,模型蒸馏本身是行业常见技术,可用于训练更轻量、低成本的模型,但也可能被竞争对手用于直接模仿甚至抄袭其他模型的核心能力。
一名知名研究机构的研究员也表示,没有什么(有效的)方法确定蒸馏的情况,现在大家都互相这么做。

此前,DeepSeek曾回应过OpenAI指控的蒸馏问题,强调V3模型的训练数据都来自于网页和电子书,但也表示相关网页上包含了大量OpenAI模型生成的答案,可能会导致基础模型间接受益于其他强大模型的知识。
也就是说,DeepSeek不否认使用了带有OpenAI模型推理的知识进行训练,但这些数据都来自于网页,不是其主动“蒸馏”的行为。
DeepSeek此前因开源模型R1受到广泛关注,该模型在性能接近国际头部产品的同时,成本大幅更低。DeepSeek即将推出新一代模型V4,据称在代码能力上有望超越Claude和ChatGPT。

对此,Anthropic表示将加强技术防御,降低蒸馏攻击的可行性,并呼吁行业、云厂商与监管机构协同应对。
针对此事,马斯克在X上转发用户评论时调侃,“他们竟敢‘偷窃’Anthropic从人类程序员那里偷走的东西?”

目前,DeepSeek、Moonshot、MiniMax三家企业,均未就此事进行回应。