全球开源大模型,前十五名全是中国的

机器之心 2025-08-25 17:09
机器之心报道

机器之心编辑部

国产开源力量的集中爆发。


都在说国内大模型正在驰骋开源领域,具体的情况如何?


近日,随着新一代大语言模型(LLM)的一波更新,开源大模型再次成为了热门讨论话题。软件工程师、自媒体 Rohan Paul 发现了一个惊人的现象:Design Arena 排行榜上排名前十几位开源 AI 模型全部来自中国。


资讯配图


Design Arena 是目前全球最大规模的众包 AI 生成设计 Benchmark 平台,它的核心机制是让真实的人类用户进行评测,基于 Elo Rating(类似于国际象棋评分体系)等级分制度进行模型对战。


用户在平台上会被随机展示两段由不同模型生成的回答,然后进行投票选择「哪一个更好」。每一次投票都会影响对应模型的 Elo 分数,进而形成动态的排行榜。Elo 核心原理是,高分选手击败低分选手,得分会很少,而低分选手爆冷战胜高分选手时,得分会很多。因此用对弈的角度来看的话,这是一个相对公平、符合认知的评分系统。


因此,不同于 MMLU、SWE-Bench 这类客观指标,Design Arena 更贴近于「用户真实体验」。新模型一上线,就能迅速通过对战获得口碑分数。


在 Design Arena 上,如果把条件设定为「开源」,可见现在的前 15 名是清一色的国产开源大模型


资讯配图


排名第一的是 DeepSeek-R1-0528,智谱的 GLM-4.5 和阿里的 Qwen 3 Coder 480B 紧随其后。


再往下我们能看到 DeepSeek、Qwen、GLM 的各种型号,Kimi 在 7 月份开源的 K2 模型…… 一直到第 16 名才是 OpenAI 最近开源的 GPT OSS 120B。


资讯配图


在前 15 名中,各家大模型厂商上榜的模型数量依次如下:



最近一段时间,国内 AI 公司不断发布新一代开源大模型,正在开拓 AI 技术的前沿。甚至对于国内科技公司来说,开源已经成为了最近一两个月发布的主旋律。


在 Hugging Face 发布的中国 AI 社区 7 月开放成果中,包括阿里、智谱、昆仑万维、月之暗面、腾讯、阶跃星辰等在内的多家厂商先后开源了 33 款大模型


资讯配图


此前还有机构 Interconnects(深度聚焦前沿 AI 研究的高质量内容平台)汇总了国内顶尖的 19 家开源模型实验室,包括 DeepSeek 这样的顶级机构,以及一些通过技术报告和小众模型崭露头角的新兴学术实验室。


资讯配图


这 19 个开源玩家依次是:DeepSeek、Qwen、Moonshot AI (Kimi)、Zhipu / Z.AI、StepFun、Tencent (Hunyuan)、RedNote (Xiaohongshu)、MiniMax、OpenGVLab / InternLM、Skywork、ByteDance Seed、OpenBMB、Xiaomi (MiMo)、Baidu (ERNIE)、Multimodal Art Projection、Alibaba International Digital Commerce Group、BAAI 以及 inclusionAI、Pangu (Huawei)。


在大模型领域里,技术和性能领先的一直是以 GPT 系列为代表的闭源大模型。但随着 Llama 系列兴起,越来越多的开源模型逐渐成为了推动技术向前进步的重要动力。近一年多时间里,国产大模型集群式的崛起,则重塑了全球 AI 版图。


现在说起开源的大模型,大多数人的第一反应早已不是 Llama,而是 Qwen 和 DeepSeek。有人认为,正是 DeepSeek 等开源大模型能够与闭源顶尖模型分庭抗礼,才让众多应用端公司得以转变工作重点,把精力放在模型调优和应用优化的工作上来,进而加速了 AI 技术的落地。


或许这样的趋势也会扭转 AI 研究社区的趋势,让未来最先进模型的开源成为必选项。


最后,在外网也有人在为中国的 AI 模型崛起寻找深层原因。这位 Illya Gerasymchuk 是数学专业的硕士,他认为原因在于数学基础 —— 目前东亚人在数学领域上已经占据了主导地位。


资讯配图


这是否和我们一直以来的印象已经有些不一样了?


参考链接:

https://www.designarena.ai/

https://x.com/rohanpaul_ai/status/1959710355208499692

https://x.com/interconnectsai/status/1957105950201950715


上海 AI Lab 26 届校招正式批开启!全岗位「无限复活甲」助你 offer 到手!
  • 投递 0 限制:简历可多次投递,心仪岗位大胆冲!

  • 100+ 职位,赛道超丰富,细分方向任你选!

  • 顶级科研平台与资源:超大规模算力集群,PB 级数据,亿级研发投入!
  • 清晰的职业发展通道:由实验室出题,为你链接顶尖高校、科研机构和行业企业!

扫描下方二维码即可投递简历。

资讯配图

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
一张照片+一段音频生成“电影大片”视频!通义万相又一重磅开源
轻量级易开发,8B参数释放大实力!科学多模态模型Intern-S1-mini开源
资讯速递 | 最新BCI开源软件平台:无代码开发脑机接口
xAI宣布开源!马斯克:中国公司是最强竞争对手!
马斯克的Grok 2开源了,但好像又没完全开
开源课程连载|如何使用 MCP 扩展你的企业架构 1,教你如何架构和构建可跨团队和工具扩展的 AI 驱动的开发者工作流
ICCV'25开源 | 浙大新作H3R:打造通用3D重建!提速200%!
港科大(广州)最新开源 | ReconVLA:通过隐式视觉重建实现机器人精准感知与操作
老宇哥出手,100W快充 + USB3.0高速传输(3A1C),这个开源HUB项目太香了!
阿里开源14B电影级视频模型!实测来了:免费可玩,单次生成时长可达分钟级
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号