距离R1-0528发布已经过去两个多月,期间,从谷歌、OpenAI、Anthropic到国内的BAT、AI六小龙等,各种模型更新动作一波接一波,被给予厚望的DeepSeek则进入了一段长长的“沉寂期”,R2模型也一再被推迟。8月19日晚间,DeepSeek团队悄然进行了一次开源模型更新,推出了V3-0324模型的新版本DeepSeek V3.1,该模型拥有685B参数,支持多种精度格式(BF16、F8_E4M3、F32),上下文长度128k。
尽管还未公布模型卡,DeepSeek V3.1就已在Hugging Face的趋势榜上升到了第四名,上线数小时后,不少网友的早期个人测试显示,其编程能力十分突出,基准分数已可与OpenAI和Anthropic的专有系统相媲美,另有分析称DeepSeek或正转向“混合模型架构”和类似GPT-5的整合策略,以应对当下的新一轮LLM竞赛。根据Aider Polyglot排行榜泄露的测试数据,DeepSeek V3.1测试实现了71.6%的通过率,比Claude Opus 4性能高出约1%,但价格却便宜约68倍,直接能排到开放权重模型第一名了。技术社区分析揭示了隐藏在模型之下的一些技术创新,有网友发现嵌入在模型架构中的四个新的特殊标记:允许实时网络集成的搜索功能和支持内部推理过程的思考标记,业内推断DeepSeek正在从自身和竞争对手的近期的错误中汲取经验,尝试去解决困扰其他混合模型的一些问题。有网友用DeepSeek-V3.1-Base写代码实测后得出结论,比近期被吐槽的GPT-5表现要好,感觉正在追平Claude-Sonnet-4,但是模型的生成美学还是差点意思,网页制作的样式和审美也很单一。相比较V3-0324版本,DeepSeek V3.1的物理理解能力有所提高,例如:编写一个p5.js程序,演示一个球在旋转的六边形内弹跳的过程,球应该受到重力和摩擦力的影响,并且必须逼真地从旋转的墙壁上弹起。有网友通过综合配置文件的变更观察到,V3.1改进了推理模式、对话轮次控制、工具调用流程等,有点“V3+R1”合体的感觉,这次更新或许是一次实验性的关于Chat、Reasoning模型融合的测试。此外,开发者测试发现,Deepseek V3.1在推理模式下比R1-0528提高了token效率,显著减少了那些可以通过模型知识和数学问题解答的题目的过度思考,不过,在某些情况下,它仍然会导致逻辑谜题的计算时间(CoT)过长。
V3.1模型除了在编码方面有所进步,在多语言能力和创意写作/角色扮演能力被吐槽略显“糟糕”,为了降低成本,DeepSeek可能要集中算力资源优化更具商业潜能的AI代码生成能力,其他方面的性能体验可能会做出一些差异化取舍。
此前传闻DeepSeek R2或将在8月下旬发布,但近期接近DeepSeek的人士称,DeepSeek R2暂无明确发布日期,官方也从不回应所谓的发布日期,上线时间节点再次被推迟。
据知情人士称,DeepSeek创始人梁文峰在内部对R2模型的整体进展感到不满意,据说,他在敦促团队设定更高的性能目标,打造一些能够让公司保持AI行业领先地位的产品,因为如今的DeepSeek不仅仅是几个模型,某种意义上也成为国产开源模型在世界的一个代表符号、一面旗帜,外界给予的期待值比一般公司要高很多。另外,据悉R2需要的训练数据量要大得多,国内可用的R2高质量数据也相对较低,加上高端GPU的严重短缺,进一步拖延了DeepSeek推出新模型的速度。DeepSeek目前的使用率情况呈现出“官方流量下滑,但生态渗透广泛”的独特态势。由于新模型不断延期,DeepSeek的使用率出现下滑,据Mydrivers统计,其使用率已从年初的50%降至目前的3%。尽管官方流量下滑,但DeepSeek的开源模型被腾讯、字节跳动、阿里、百度等众多第三方平台广泛接入,据估算有超过70%的DeepSeek模型调用量发生在这些第三方平台。第三方机构onelittleweb给出的分析显示,就其全球市场表现而言,DeepSeek模型以3.96%的市场份额在全球AI聊天机器人中综合评分排名第五,年度访问量达27.4亿次。DeepSeek对于模型赛道而言,不仅是一个技术突围的标杆,也是一条通过开源开放、极致性价比和深耕产业应用,来构建国产模型差异化竞争力和发展生态的重要路径。OpenAI的CEO山姆·奥特曼在最近的采访中表示,美中人工智能竞赛的关系错综复杂,其影响远非短期简单的 “谁领先” 排行榜所能概括。
“尤其在推理能力方面,中国或许能更快取得进展。这其中涉及研究、产品等多个层面。” 他说,“我认为事情不会简单到用‘美国领先还是中国领先’来概括。”
尽管美国不断升级对中国市场的半导体出口管制,但奥特曼认为这项政策并不能跟上技术发展的实际情况,并直言这行不通。
中国的人工智能进步影响了OpenAI对其自身模型的市场策略变化。
尽管该公司长期以来一直拒绝将其技术完全开源,但奥特曼表示,来自中国模型(尤其是像DeepSeek这样的开源系统)的竞争是OpenAI最近决定发布自己开放权重模型的一个重要因素,以增强其与中国竞争对手的竞争地位。
DeepSeek的命运不仅仅是一家公司的事,实际上也是国内AI阵营技术路线(开源vs闭源)和发展模式(创新创业vs国际巨头)的宝贵探路,在高端算力封锁之下,这条路注定不易,但每一步创新探索都具有非凡的意义,期待DeepSeek能持续带来惊喜,真正实现里程碑式的新突破。
-END-
【2025免费新年礼】:了解最新科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会,领取100份AI科技商业研报合集,加群共同探讨与成长——