梁文锋论文登上《自然》封面,正面回应DeepSeek-R1蒸馏质疑

TechWeb 2025-09-18 15:37
资讯配图

由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。《自然》杂志还公布了同行评审报告,DeepSeek-R1也成为全球首个经过同行评审的主流大语言模型。

发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异,披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。

DeepSeek-R1发布之初,曾有传闻称该模型使用了OpenAI的模型进行蒸馏。在同行评审文件中,DeepSeek介绍,DeepSeek-R1的基座模型DeepSeek-V3 Base使用的数据全部来自互联网,可能包含GPT-4生成的结果,但绝非有意而为之,DeepSeek-V3-Base并没有引入在合成数据集上进行大规模监督蒸馏的“冷却”阶段。

DeepSeek-V3-Base的数据截止时间为2024年7月,当时尚未发布任何公开的先进推理模型,这进一步降低了从现有推理模型中无意蒸馏的可能性。

DeepSeek为DeepSeek-R1新增了一份全面的安全报告,对DeepSeek-R1的安全性进行了全面评估,证明其安全性领先同期发布的前沿模型。

报告提到,DeepSeek-R1在服务部署中引入了外部风险控制系统,不仅可以基于关键词匹配识别不安全对话,还使用DeepSeek-V3直接进行风险审查,判断是否应拒绝响应。DeepSeek建议开发者在使用DeepSeek-R1时,部署类似的风险控制系统。

在公开安全基准测试和内部安全研究中,DeepSeek-R1在大多数基准上超过了Claude-3.7-Sonnet、GPT-4o等前沿模型。开源部署版本的安全性虽不及具备外部风险控制系统的版本,但仍拥有中等水平的安全保障。

《自然》杂志评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。随着AI技术日渐普及,大模型厂商们无法验证的宣传可能对社会带来真实风险。依靠独立研究人员进行的同行评审,是抑制AI行业过度炒作的一种有效方式。

—【 THE END 】—
往期精彩文章回顾:
资讯配图
特斯拉“车顶维权”女车主,胜诉!

资讯配图
14.98万起!比亚迪2026款海豹07DM-i上市

资讯配图
息战不可能!罗永浩怒邀西贝创始人直播对话

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号