0.7元/百万token碾压竞品! 小米新开源大模型,卷出AI普惠关键密码

电子发烧友网 2025-12-21 00:00
电子发烧友网报道(文/章鹰)12月17日,2025小米人车家全生态合作伙伴大会举行,小米MiMo大模型负责人罗福莉首次登场,她解读小米最新开源大模型MiMo-V2-Flash,抛出“全球开源模型Top2”“推理成本仅为标杆模型2.5%”等重磅信息
0.7元/百万token碾压竞品! 小米新开源大模型,卷出AI普惠关键密码图1
截至2025年12月19日,小米发布的 MiMo-V2-Flash、深度求索(DeepSeek)的 DeepSeek-V3.2,以及阿里巴巴的 Qwen-3均为当前国产大模型中的代表性产品。在与DeepSeek V3.2、千问Qwen-3对比当中,小米开源大模型到底有哪些优势和应用价值?本文进行详细分析。

全球开源模型Top2,主打超绝性价比

MiMo-V2-Flash是小米全新一代面向Agent的基座模型,总参数309B,激活参数15B,支持256k上下文窗口,整体针对推理、编码和Agent场景构建,支持混合思维模式,允许用户切换“思考”和即时回答模式。
0.7元/百万token碾压竞品! 小米新开源大模型,卷出AI普惠关键密码图2
目前,MiMo-V2-Flash推理吞吐速度为每秒150个token,成本定价0.7元/每百万输入token,2.1元/每百万输出token,主打超绝性价比。
在架构设计上,小米MiMo-V2-Flash采用了混合注意力机制。其混合模块设计包含8个混合块,其中每5个滑动窗口注意力(SWA)层对应1个全局注意力层。在上下文支持能力上,该模型原生支持32K的训练,并且能够扩展到256K的上下文支持。
从性能表现来看,小米MiMo-V2-Flash在通用基准测试中,与DeepSeek-V3.2不相上下,同时延迟大幅降低。在SWE-Bench验证和多语言集中分别取得了73.4%和71.7%的成绩。尤为突出的是其速度优势,在Day-0时,输出速度高达每秒150个token,这一速度在同类模型中处于领先地位。
0.7元/百万token碾压竞品! 小米新开源大模型,卷出AI普惠关键密码图3
图来自小米官方微信
在多个Agent测评基准上,MiMo-V2-Flash进入全球开源模型Top 2;编码能力超过所有开源模型,比肩标杆闭源模型Claude 4.5 Sonnet,但推理成本仅为其2.5%,生成速度提升2倍。

小米MiMo-V2-Flash推理效率高,来源两大创新

罗福莉指出,我们要围绕极致的推理效率去重新设计模型结构。模型结构主要源自两大创新:一、模型注意力机制采用了Hybrid Sliding Window Attention(Hybrid SWA/混合滑动窗口注意力机制),其中SWA与Full Attention(全局注意力机制)的比例是5:1滑动窗口只看 128  token。相较于一些复杂的Linear Attention(线性注意力机制),SWA在兼顾长短文的推理、知识检索等方面更胜一筹。
二是在于MTP(Multi-Token Prediction)。罗福莉表示,团队在训练时加入了一层MTP层以提高基座模型能力,并在微调时也加入了更多MTP层,最终在推理时加入了3层MTP,以加速并行token验证的方式实现了2-2.6倍推理速度的提升。
还有,为了提高强化学习训练的稳定性,MiMo团队提出了一种叫做Multi-Teacher On-Policy Distillation(MOPD)的后训练范式。相较于传统SFT+RL(微调+强化学习)的后训练方式,它可以提供稠密的token level监督学习信号,以简单快速的方式获得各个专家模型的能力。
此外,小米并推出线上AI聊天服务“Xiaomi MiMO Studio”,用户可在其中体验“MiMo-V2-Flash”。
罗福莉在社交平台上透露了更多信息,MiMo-V2-Flash 已正式上线。这只是我们 AGI 路线图上的第二步。
小米发布MiMo-V2-Flash,不仅仅是一次大模型领域的技术创新,更是其“人车家全生态”战略的关键支点。该模型通过多项架构创新与成本优化,为 AI智能体(AI Agent)在终端设备上的落地提供了前所未有的赋能能力。
我们认为,MiMo-V2-Flash 不只是“一个更快的大模型”,而是小米打造 “终端原生智能体操作系统” 的基石。它有机会让每一台小米设备都可能成为一个 有记忆、会思考、能行动的智能体节点,最终助力实现雷军所说的“AI for All Devices, All the Time”。

0.7元/百万token碾压竞品! 小米新开源大模型,卷出AI普惠关键密码图4

声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 开源 小米 大模型
more
中国首发 红帽发布全球首个通过ASIL安全功能等级认证的开源Linux车用操作系统
又一国产图像大模型开源!实测连续P图绝了,中文渲染是短板
马斯克:在地球建核聚变装置愚蠢至极;英伟达发布新一代开源大模型;全球首款猫用减肥药进入临床试验 | 极客早知道
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
高能开源|“fpgadeveloper”—— FPGA 工程师的代码仓库,学习者的宝藏资源库
RoboTidy即将开源:让机器人在家庭场景“游刃有余”
Kimi K2 Thinking突袭!智能体&推理能力超GPT-5,网友:再次缩小开源闭源差距
蹭豆包手机热度?智谱AutoGLM开源,AI手机终于起风了
谷歌深夜重磅开源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%
英伟达开源全新大模型:黄仁勋不想只「卖铲子」
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号