鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI
开源大模型,进入中国时间。
10月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。
阿里的Qwen系列和DeepSeek,更是从2024年下半年起,就在开源社区构建起越来越深远的影响力。

这一结果正在引发热议。有不少网友指出:这种情况确实已经持续了很长一段时间。
比如半年前Llama 4翻车时的梗图,就又被挖了出来:

无论是模型质量还是开放程度,这一次,国产模型已经从追赶者,转变为引领潮流的一方。

紧跟SOTA闭源模型
更具体的情况,可以在LMArena公开榜单中窥见一二。
在文本排行榜中,顶级闭源模型如GPT-5、Gemini-2.5-pro、Claude-Sonnet-4.5等之后,紧随而来的就是智谱的GLM-4.6和DeepSeek-v3.2。
而Qwen3-max-preview则跻身到了TOP3,不过目前该版本模型并未开源。

前端开发排行榜中,国产开源模型更是实现了跟编程SOTA Claude的分庭抗礼,DeepSeek-R1/V3.1、GLM-4.6和Qwen3-Coder都排到了前10。

视觉方面,腾讯的Hunyuan-vision-1.5注和Qwen3同样紧跟闭源SOTA,位列开源最强。
注:Hunyuan-vision-1.5处于计划开源状态,技术报告和模型权重尚未公布。

视频模型方面,开源模型中Wan-v2.2表现最佳。
值得注意的是,在这个领域,国产闭源模型同样表现不俗,Kling-2.5、Seedance-v1-pro、Hailuo-02等都位居榜单前列。
另一个角度,从HuggingFace的模型下载量和模型趋势上,也可以看出开源模型领域,中国力量越来越活跃、越来越强大了。
在趋势榜中,蚂蚁的Ling-1T、智谱的GLM-4.6,都是当下最受关注的开源模型。

最受欢迎模型,依然由DeepSeek-R1担当。

下载量方面,Qwen3是下载量最高的模型之一。如果将参数规模具体到百亿级,Qwen3更是领先包括gpt-oss在内的其他开源模型。

竞争推动创新,而开源已经被证明,是加速创新的重要力量。
有网友认为:现在,这股推动力来自中国。

还有人指出,开源模型领域主导地位的转变,不仅仅关乎谁将引领潮流,更重要的是,这或将重新定义全球创新格局。

Llama 5要无了?
Anyway,回到开头那张图片上,中国开源力量对大模型格局的冲击,一个重要的节点是“DeepSeek时刻”。
而Llama 4的翻车,也不能说没有贡献一份力量(doge)。
最近小扎不是终于把OpenAI前CTO Mira的公司联创Andrew Tulloch挖走了嘛,传闻是给了一份35亿美元的offer。
消息一出,又把大家对Llama 5的关注给勾起来了:挖了这么多人,花了这么多钱,Meta超级智能实验室能搞出好东西来吧?
但这边刚期待,就有人冒出来泼冷水:Llama 5无了。

爆料人说是Meta的数据集供应方。不过后来他又删掉了这个回复,表示以上并非官方消息,他只是从另一个获得Meta资金的团队那里得到了这个消息。

那么,被亚历山大·王动摇了开源决心的小扎,究竟会拿出点什么?
板凳,瓜子,长期准备吧~

参考链接:
[1]https://x.com/burkov/status/1977942735962206666
[2]https://lmarena.ai/