2025年度中文大模型测评揭晓:海外闭源领跑,国产开源强势崛起

科技区角 2026-02-04 15:31

【科技纵览】2月4日,权威评测机构SuperCLUE正式发布《2025年年度中文大模型基准测评报告》。本次评估共纳入23个来自全球的主流大模型,在数学推理、科学推理、代码生成等六大核心能力维度展开全面比拼。


测评结果显示,海外闭源模型仍稳居综合排名前列。其中,Anthropic推出的Claude-Opus-4.5-Reasoning以68.25分摘得桂冠;谷歌的Gemini-3-Pro-Preview和OpenAI的GPT-5.2(high)分别获得65.59分与64.32分,位列第二和第三,共同包揽前三席位。

值得关注的是,国产大模型正加速由“跟跑”转向“并跑”。在开源类别中,Kimi-K2.5-Thinking以61.50分成为国内最佳,位居全球第四;闭源阵营方面,Qwen3-Max-Thinking以60.61分排名第六,展现出强劲追赶势头。

在细分任务中,国产模型实现局部突破:Kimi-K2.5-Thinking在代码生成单项中以53.33分拔得头筹;Qwen3-Max-Thinking则在数学推理任务中与Gemini-3-Pro-Preview同获80.87分,并列世界第一。

整体来看,海内外大模型在开闭源路径上呈现分化格局——闭源领域由海外主导、国产持续追赶,而开源生态则已由国内厂商全面引领,其Top5模型均显著优于海外同类产品。这一趋势表明,中文大模型正进入高质量协同发展的新阶段。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源 大模型
more
Token太贵,中国开源模型一夜之间霸榜了
现象级开源AI助手Clawdbot三度更名定为OpenClaw,社区生态与安全挑战并存
OpenAI 收购 Astral、Claude Channels、X 算法开源 | AI 资讯
当 AI 开始报复人类,开源世界的第一起「自主攻击」事件
端侧AI进入生态与场景决胜时代,上海海思给出端侧AI最优解:五芯布局、开源OS、兼容200款模型
阿里辟谣“千问团队集体离职”传闻,强调开源战略不变并加大AI人才引进
全国首个开源鸿蒙+RISC-V智慧高速方案落地深圳,机荷高速迈入施工筹备阶段
领跑!30B模型登顶OpenAI科研榜单,UniPat AI冲上开源科研最前线
MWC围观、OpenClaw屠榜!2026 AI变天:从“陪聊”到“干活”,中国开源模型成全球开发者首选
想入局VLA却不知从何下手?NTU&中大开源VLANeXt:从12个维度系统解析VLA模型设计空间
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号