被曝蒸馏DeepSeek还造假！欧版OpenAI塌房了

量子位 2025-08-14 15:33

henry 发自凹非寺
量子位 | 公众号 QbitAI

离职掀桌！Mistral被曝“蒸馏”DeepSeek。

网友在推特上爆料，一位Mistral离职女员工群发邮件，直指公司多项黑幕。

其中最劲爆的就是：Mistral最新模型疑似直接蒸馏自DeepSeek，却对外包装成RL成功案例，并刻意歪曲基准测试结果。

说到Mistral，这家公司被誉为欧洲版OpenAI，是全球开源明星玩家之一，模型性能一直备受好评。

也正因为声誉突出，这次爆料才显得格外震撼。

资讯配图

早在今年6月，就有博主通过“语言指纹”分析，发现Mistral-small-3.2和DeepSeek-v3很像。

资讯配图

有意思的是——今年2月，还有网友调侃DeepSeek是“中国的Mistral”。

结果半年过去，剧情反转：Mistral不仅没跑赢DeepSeek，还被曝“借”了人家的成果。

这波啊，这波叫回旋镖自带GPS，绕半圈又精准扎回自己身上。

Mistral蒸馏DeepSeek实锤

就像我们开头提到的，推特博主Sam Peach通过分析模型输出中过度使用的词汇模式（Slop），发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。

这种相似性通常很难通过独立训练偶然出现，所以很可能就是蒸馏（distillation）的结果：

Mistral-small-3.2“学习”了DeepSeek-v3的输出风格。

具体来说，Sam Peach是这样做的。

他先统计了模型在创意写作（creativewriting）的输出中，比人类文本更常出现的词和n-gram（词组）。

然后他把这些把数据整合起来，形成一个特征集。

最后把这些高频特征进行层次聚类（hierarchicalclustering），生成了一张“相似性图”。

通过比较相似性图中模型的远近位置，就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近，这就表明了它们的输出模式高度相似。资讯配图

最新的爆料则进一步指明，Mistral模型和DeepSeek相似不是巧合，而是可能使用了蒸馏。

由于爆料人Susan Zhang的推特设置可见范围，更多爆料信息暂时无从得知。

但这里需要说明，蒸馏并不是一件违规的事，现在很多模型都是通过这一方法快速提升能力。

资讯配图

Mistral的问题在于，可能隐藏了这部分事实。

离职员工说，Mistral这样做是在假装自家模型的强化学习有效，这不仅歪曲了基准测试结果，而且误导公众。

不少人也认同这一观点：蒸馏模型必须标注，保持透明性才是关键。

资讯配图

此外还有网友表示，蒸馏实际上为模型开发开辟了一条捷径，好让大家不用再重复造轮子。

资讯配图

官方暂无回应

这事儿颇具争议，除了事件本身，主要还在于Mistral在开源AI圈的地位不低。

它成立于2023年，base法国巴黎，一直被称为欧洲版OpenAI。由前Google DeepMind的Arthur Mensch和前Meta的Guillaume Lample与Timothée Lacroix联合创立。

在今年8月，Mistral被曝估值达到100亿美元，且正在筹集新一轮10亿美元融资。

而在上一轮融资中（2024年6月），Mistral完成了一轮由General Catalyst领投的6亿欧元（6.45亿美元）的融资，这使其估值上升至58亿欧元（62亿美元），排名全球第四（美国湾区外排名第一）。

资讯配图

从公司成立以来，Mistral一直保持开源路线，今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。

相较于主流的大语言模型，主打开源、小快灵的Mistral，在多语言处理和推理能力方面具备相当的竞争力，在大模型市场中占据着独特的地位。

同时他们也推出了自家聊天机器人LeChat，对标ChatGPT，内置深度研究模式、原生多语言推理和高级图像编辑等功能。

截至目前，Mistral官方还没有回应，就在昨天他们还发布了新模型Mistral Medium V3.1。

参考链接：

[1]https://x.com/sam_paech/status/1937786948380434780

[2]https://github.com/sam-paech/slop-forensics

[3]https://techcrunch.com/2025/07/18/what-is-mistral-ai-everything-to-know-about-the-openai-competitor/

[4]https://github.com/sam-paech/slop-forensics

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

🎉 希望了解AI产品最新趋势？

量子位智库「AI 100」2025上半年

「旗舰产品榜」和「创新产品榜」

给出最新参考👇

🌟 点亮星标 🌟

科技前沿进展每日见

声明：内容取材于网络，仅代表作者观点，如有内容违规问题，请联系处理。

AI

more

3700元，HTC首款AI眼镜发布，谷歌OpenAI模型都能用，36小时超长待机

智东西 5小时前

3700元，HTC首款AI眼镜发布，谷歌OpenAI模型都能用，36小时超长待机

AI赋能持续变现，腾讯重回扩张周期

36氪 7小时前

AI赋能持续变现，腾讯重回扩张周期

LeetCode刷够100小时，学会找人内推，OpenAI员工下场教你拿Offer

机器之心 9小时前

LeetCode刷够100小时，学会找人内推，OpenAI员工下场教你拿Offer

“后门”风险实锤！美国在AI芯片货物中安“追踪器”

电子工程专辑 11小时前

“后门”风险实锤！美国在AI芯片货物中安“追踪器”

Meta华人天才毕树超「叛逃」预言：OpenAI未竟交互革命，暗藏万亿赛道

新智元 9小时前

Meta华人天才毕树超「叛逃」预言：OpenAI未竟交互革命，暗藏万亿赛道

聚焦大模型下半场中国芯突围！全球AI芯片峰会定档9月，北大中科院计算所领衔

智东西 8小时前

聚焦大模型下半场中国芯突围！全球AI芯片峰会定档9月，北大中科院计算所领衔

今日直播预告｜相AI相生，共赴未来！总台《2025中国·AI盛典》今晚播出【附完整节目单】

清华大学人工智能国际治理研究院 7小时前

今日直播预告｜相AI相生，共赴未来！总台《2025中国·AI盛典》今晚播出【附完整节目单】

【报告】人工智能专题四：2025AI与十五五规划——多行业联合人工智能7月报（附PDF下载）

人工智能产业链union 5小时前

【报告】人工智能专题四：2025AI与十五五规划——多行业联合人工智能7月报（附PDF下载）

被曝蒸馏DeepSeek还造假！欧版OpenAI塌房了

量子位 10小时前

被曝蒸馏DeepSeek还造假！欧版OpenAI塌房了

领克10 EM-P开启预售，「AI电混」到底强在哪里？

电动邦 13小时前

领克10 EM-P开启预售，「AI电混」到底强在哪里？

Copyright © 2025 成都区角科技有限公司

蜀ICP备2025143415号-1

川公网安备51015602001305号