全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币

量子位 2025-10-28 09:17

克雷西发自凹非寺
量子位 | 公众号 QbitAI

开源模型王座再次易主，依旧是国产模型！

不过之前霸榜的DeepSeek和Qwen来自杭州，现在变成上海的Minimax了。

在第三方评测机构Artificial Analysis的测试中，Minimax M2以61分获得了开源模型第一，紧随Claude 4.5 Sonnet。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图1

官方介绍，Minimax M2专为智能体和编程而生，编程能力和Agent表现出众。

而且经济高效，推理速度是Claude 3.5 Sonnet的两倍，API价格却只有8%。

Minimax表示，智能水平、速度和成本在过去被视为“不可能三角”，但随着M2的出世，这个三角被打破了。

目前，M2的完整模型权重已经开源，采用MIT协议，在线Agent平台和API也限时免费。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图2

8%成本实现Claude级水平

Minmax M2是一个稀疏度较高的MoE模型，总参数量230B，激活参数量仅有10B。

网友表示10B的激活参数运行起来会非常快，如果配上Cerebras或者Groq这样的推理加速平台，有望跑到每秒上千Token。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图3

另一个特色是采用了交错的思维格式，使得模型能够规划和验证跨多个对话的操作步骤，这对于Agent推理至关重要。

如开头介绍，Minimax官方将M2定义为一个专为智能体和编程而生的模型。

它专为端到端开发工作流程而构建，而且表现出对复杂、长链工具调用任务的出色规划和稳定执行能力，支持Shell、浏览器、Python代码解释器和各种MCP工具的调用。

在Agent最关键的三个能力——编程能力、工具使用能力和深度搜索能力上，M2在工具使用和深度搜索方面上都不逊于海外顶尖模型，编程能力也在国内名列前茅。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图4

综合表现上，M2在Artificial Analysis的测试中，获得了总排名第五、开源第一的成绩。

该测试使用了10个热门数据集，包括MMLU Pro、GPQA Diamond、人类最后测试、LiveCodeBench等。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图5

而M2的定价是0.3美元/2.1人民币每百万输入Token，1.2美元/8.4人民币每百万输出Token，只要Claude 3.5 Sonnet的8%。

以Artificial Analysis的成绩为基准，Minimax绘制了一张图来比较各大模型性价比（横轴越向右成本越低）。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图6

在线推理服务的速度则可达每秒100Token，Minimax也画了一张图体现以速度衡量的性价比。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图7

同时，Minimax团队还针对智能体、全站开发和Terminal Use三项任务对M2和其他模型进行了一对一比拼。

结果M2相比于Claude Sonnet 4.5、GLM 4.6、Kimi-K2以及DeepSeek V3.2均有极高的Win+Tie比例，同时成本非常低廉。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图8

为了更直观地体现M2的Agent能力，Minimax已经把M2部署到了Agent平台，限时免费使用，按官方说法，免费期直到服务器扛不住为止。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图9

同时在该平台上，也展示了许多Minimax Agent的现成作品。

Minimax Agent：能写程序，还会做PPT

利用Minimax的Agent平台，可以写出各式各样的网页或在线应用。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图10

当然像很多经典游戏，也都能用它在Web环境当中复刻并直接部署。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图11

甚至有网友创作的在线五子棋游戏平台，不仅有游戏本体，还引入了在线对战、观战、在线聊天，甚至是用户注册等功能。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图12

除了编程，也可以生成各种主题的调研报告或者PPT。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图13

在X上，也有网友展示了自己用M2 Agent编程的实战成果，仅通过三轮反馈就完成了一个足球小游戏的制作。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图14

可以说效果非常不错。

模型表现之外，M2使用的注意力机制，也引发了网友们的讨论。

混合注意力vs全注意力

有网友从vllm的代码当中看出了M2的更多技术细节，表示M2采用类似GPT-OSS的全注意力和滑动窗口注意力（SWA）的混合机制，

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图15

不过Minimax NLP负责人指正，表示一开始确实想在预训练阶段引入SWA，但发现会造成性能损失，所以最后使用的是全注意力。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图16

Falcon团队的技术人员看了之后表示，他们在训练模型的时候也发现了同样的现象，SWA混合注意力会降低模型性能，这和一些论文的研究不符。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图17

在部分论文和实践中，SWA在提升效率的同时可以保持性能，如Mistral和谷歌Gemma模型的相关研究均支持此观点。

但Minimax的实际测试显示其在长程依赖任务上存在局限。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图18

同时，M2也没有采用Lightning Attention（线性注意力的一种变体），原因也是因为性能损失。

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币图19

同样与之相反，有论文主张线性注意力在长序列任务中更具优势。

到底哪种路线更优，可能还是要看具体需求，但至少从M2的表现上看，Minimax选择的的确是一种适合自己的方式。

Agent平台：https://agent.minimax.io
Hugging Face：https://huggingface.co/MiniMaxAI/MiniMax-M2
参考链接：
[1]https://www.minimax.io/news/minimax-m2
[2]https://venturebeat.com/ai/minimax-m2-is-the-new-king-of-open-source-llms-especially-for-agentic-tool
[3]https://x.com/jessi_cata/status/1982936050256490968
[4]https://x.com/JingweiZuo/status/1982822979030692356

声明：内容取材于网络，仅代表作者观点，如有内容违规问题，请联系处理。

开源

more

2025中文大模型终极PK：GPT-5一骑绝尘，国产开源却打出「性价比王炸」！

水木人工智能学堂 1周前

2025中文大模型终极PK：GPT-5一骑绝尘，国产开源却打出「性价比王炸」！

横跨三年的技术复盘！重磅综述解读：2023至2025，具身智能开源路线图

深蓝具身智能 6天前

横跨三年的技术复盘！重磅综述解读：2023至2025，具身智能开源路线图

AI杀入美股，DeepSeek又是第一！港大90后开源，AI股神人人都能造

新智元 3天前

AI杀入美股，DeepSeek又是第一！港大90后开源，AI股神人人都能造

ICLR'25 开源 | 推翻传统NBV，超复杂室内环境实时探索重建大突破！

3D视觉工坊 1天前

ICLR'25 开源 | 推翻传统NBV，超复杂室内环境实时探索重建大突破！

手把手带你入门机器人学习，HuggingFace联合牛津大学新教程开源SOTA资源库

机器之心 3天前

手把手带你入门机器人学习，HuggingFace联合牛津大学新教程开源SOTA资源库

大模型优秀大脑齐聚硬核开源聚会，SGLang社区举办国内首次Meetup

机器之心 1天前

大模型优秀大脑齐聚硬核开源聚会，SGLang社区举办国内首次Meetup

重磅！DeepSeek再开源：视觉即压缩，100个token干翻7000个

新智元 1周前

重磅！DeepSeek再开源：视觉即压缩，100个token干翻7000个

美团视频生成模型来了！一出手就是开源SOTA

量子位 2天前

美团视频生成模型来了！一出手就是开源SOTA

刚刚，Dexbotic开源！VLA性能+46%，机器人叠盘子100%成功，统一具身智能底座

新智元 1周前

刚刚，Dexbotic开源！VLA性能+46%，机器人叠盘子100%成功，统一具身智能底座

破解长视频理解困局！MIT&英伟达最新开源StreamingVLM:统一实时流式视觉语言理解框架

AI生成未来 1周前

破解长视频理解困局！MIT&英伟达最新开源StreamingVLM:统一实时流式视觉语言理解框架

Copyright © 2025 成都区角科技有限公司

蜀ICP备2025143415号-1

川公网安备51015602001305号