开源模型TOP5,被中国厂商包圆了

量子位 2025-10-15 14:26
鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

开源大模型,进入中国时间。

10月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。

阿里的Qwen系列和DeepSeek,更是从2024年下半年起,就在开源社区构建起越来越深远的影响力。

开源模型TOP5,被中国厂商包圆了图1

这一结果正在引发热议。有不少网友指出:这种情况确实已经持续了很长一段时间。

比如半年前Llama 4翻车时的梗图,就又被挖了出来:

开源模型TOP5,被中国厂商包圆了图2

无论是模型质量还是开放程度,这一次,国产模型已经从追赶者,转变为引领潮流的一方。

开源模型TOP5,被中国厂商包圆了图3

紧跟SOTA闭源模型

更具体的情况,可以在LMArena公开榜单中窥见一二。

在文本排行榜中,顶级闭源模型如GPT-5、Gemini-2.5-pro、Claude-Sonnet-4.5等之后,紧随而来的就是智谱的GLM-4.6和DeepSeek-v3.2。

而Qwen3-max-preview则跻身到了TOP3,不过目前该版本模型并未开源。

开源模型TOP5,被中国厂商包圆了图4

前端开发排行榜中,国产开源模型更是实现了跟编程SOTA Claude的分庭抗礼,DeepSeek-R1/V3.1、GLM-4.6和Qwen3-Coder都排到了前10。

开源模型TOP5,被中国厂商包圆了图5

视觉方面,腾讯的Hunyuan-vision-1.5和Qwen3同样紧跟闭源SOTA,位列开源最强。

注:Hunyuan-vision-1.5处于计划开源状态,技术报告和模型权重尚未公布。

开源模型TOP5,被中国厂商包圆了图6

视频模型方面,开源模型中Wan-v2.2表现最佳。

值得注意的是,在这个领域,国产闭源模型同样表现不俗,Kling-2.5、Seedance-v1-pro、Hailuo-02等都位居榜单前列。

开源模型TOP5,被中国厂商包圆了图7
开源模型TOP5,被中国厂商包圆了图8

另一个角度,从HuggingFace的模型下载量和模型趋势上,也可以看出开源模型领域,中国力量越来越活跃、越来越强大了。

在趋势榜中,蚂蚁的Ling-1T、智谱的GLM-4.6,都是当下最受关注的开源模型。

开源模型TOP5,被中国厂商包圆了图9

最受欢迎模型,依然由DeepSeek-R1担当。

开源模型TOP5,被中国厂商包圆了图10

下载量方面,Qwen3是下载量最高的模型之一。如果将参数规模具体到百亿级,Qwen3更是领先包括gpt-oss在内的其他开源模型。

开源模型TOP5,被中国厂商包圆了图11

竞争推动创新,而开源已经被证明,是加速创新的重要力量。

有网友认为:现在,这股推动力来自中国。

开源模型TOP5,被中国厂商包圆了图12

还有人指出,开源模型领域主导地位的转变,不仅仅关乎谁将引领潮流,更重要的是,这或将重新定义全球创新格局。

开源模型TOP5,被中国厂商包圆了图13

Llama 5要无了?

Anyway,回到开头那张图片上,中国开源力量对大模型格局的冲击,一个重要的节点是“DeepSeek时刻”。

而Llama 4的翻车,也不能说没有贡献一份力量(doge)。

最近小扎不是终于把OpenAI前CTO Mira的公司联创Andrew Tulloch挖走了嘛,传闻是给了一份35亿美元的offer。

消息一出,又把大家对Llama 5的关注给勾起来了:挖了这么多人,花了这么多钱,Meta超级智能实验室能搞出好东西来吧?

但这边刚期待,就有人冒出来泼冷水:Llama 5无了。

开源模型TOP5,被中国厂商包圆了图14

爆料人说是Meta的数据集供应方。不过后来他又删掉了这个回复,表示以上并非官方消息,他只是从另一个获得Meta资金的团队那里得到了这个消息。

开源模型TOP5,被中国厂商包圆了图15

那么,被亚历山大·王动摇了开源决心的小扎,究竟会拿出点什么?

板凳,瓜子,长期准备吧~

开源模型TOP5,被中国厂商包圆了图16

参考链接:
[1]https://x.com/burkov/status/1977942735962206666
[2]https://lmarena.ai/


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
搜集了几个适合嵌入式的开源项目!
LLaVA-OneVision-1.5全流程开源,8B模型预训练只需4天、1.6万美元
国产游戏理解模型刷新SOTA,对话逗逗AI CEO:开源模型+行业数据是突破关键
开源编程模型王座易主了,谁能想到新SOTA是快手
盘点9月开源大模型,看完才能十一放假!
第二代InfLLM开源,同尺寸快三倍!零参数,可训练稀疏注意力
开源模型TOP5,被中国厂商包圆了
Qwen3-VL再添丁!4B/8B Dense模型开源,更轻量,仍强大
北大开源TrackVLA++:赋予机器人推理与记忆,跟踪成功率飙升12%
推理速度10倍提升,蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号