【区角快讯】3月30日,权威中文大模型评测平台SuperCLUE发布2026年3月最新测评结果,共有22款国内外主流模型参与本轮角逐。字节跳动推出的豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分的成绩位居国内第一,并成功跻身全球第一梯队。

本次评估涵盖数学推理、科学推理、代码生成等六大核心能力维度,旨在全面衡量模型的综合智能水平。在整体排名中,海外闭源模型仍占据领先位置,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)以及OpenAI的GPT-5.4(xhigh)分别位列前三甲。
值得注意的是,豆包总分仅比GPT-5.4低0.95分,在多项任务中展现出强劲追赶态势,尤其在智能体任务规划方面表现突出,已超越部分国际竞品,进入全球前五行列。
小米集团亦取得显著进展,其MiMo-V2系列两款模型均成功入榜。其中,闭源版本MiMo-V2-Pro获得60.67分,在闭源模型中排名靠前,并在数学推理单项中斩获84.03分的高分;而开源版MiMo-V2-Flash虽以49.97分暂居榜单后段,但在代码生成等特定场景中展现出一定应用潜力。
此外,国产模型在开源赛道表现尤为亮眼。Kimi-K2.5-Thinking与Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜单前三,大幅领先于海外同类产品,彰显中国AI基础模型生态的快速成熟与技术自信。
当前,大模型竞争已从“参数规模”转向“场景落地与任务泛化能力”,国产阵营正通过差异化路径加速缩小与国际顶尖水平的差距。