AI INSIGHT · 深度观察
由 AI 收集生成,可能有幻觉未全文校正
可能未来资讯拼的可信度是另一方面,欢迎批评
2026 年 2 月 11 日

2 月 11 日,智谱 AI(Z.ai)正式发布第五代大语言模型 GLM-5。这款 745B 参数的 MoE 架构模型,在发布首日就引发 Z.ai 平台流量暴涨 10 倍,此前以「Pony Alpha」的匿名身份在 OpenRouter 上悄然测试一周,被社区发现后智谱港股两日暴涨 60%。
同日,DeepSeek V4 和 MiniMax M2.5 也密集发布——春节前夕的中国 AI 军团,正在集体冲刺。
架构解剖:745B 参数的 MoE 巨兽
745B
总参数量
44B
单次激活参数
256
专家数量
202K
上下文窗口
核心架构特征
MoE 架构:256 个路由专家 + 1 个共享专家,每个 token 激活 8 个专家(稀疏度 5.9%)
稀疏注意力(DSA):采用与 DeepSeek-V3 同款的 Lightning Indexer,仅对 Top-k 个相关 token 计算注意力
多 Token 预测(MTP):同时预测多个后续 token,显著提升生成效率
MLA 注意力压缩:KV LoRA Rank 512,Q LoRA Rank 2048,大幅降低 KV Cache 内存
78 层 Transformer:隐藏维度 6144,词表大小 154,880
与上一代对比
GLM-4.7(上一代旗舰)约 355B 参数 / 12B 激活。GLM-5 总参数翻倍至 745B,激活参数从 12B 跃升至 44B,是一次全面的规模跃迁。
「Pony Alpha」悬疑:一匹马引发的 AI 侦探大戏
2 月 6 日,一个名为「Pony Alpha」的匿名模型突然出现在 OpenRouter 平台上,标注为来自「前沿实验室的隐身模型」,免费使用,200K 上下文。
首日即爆:处理超 400 亿 token,收到 20.6 万次请求。
社区很快开始「破案」:
线索一:系统提示测试时,模型自报身份「I'm GLM」
线索二:Tokenizer 行为与 GLM-4 系列完全吻合
线索三:「Pony」是马,2026 年是马年——智谱的生肖彩蛋
线索四:发布时间恰好与智谱春节前发新模型的预告吻合
线索五:在敏感话题上的审查行为与国产模型一致
开发者 Marcus Wade 在正式发布前一周就用 Pony Alpha 做实际编码工作,评价:「GLM-5 与 Claude Code Opus 4.6 之间的差距已经非常小了。」他在 Claude Code 和 Kilo Code 环境中实测,认为 GLM-5 在编码和 Agent 能力上已达到一线水准。
全华为芯片训练:国产算力里程碑
GLM-5 完全使用华为昇腾芯片 + MindSpore 框架训练,实现了对美国制造半导体硬件的零依赖。这是迄今为止使用国产算力训练的最大规模前沿模型之一。
此前,智谱的 GLM-Image 也已在华为硬件上完成训练。随着美国芯片出口管制收紧,智谱正在证明:国产算力栈已经具备训练世界级大模型的能力。
GitHub + HuggingFace 生态布局
已开源
HuggingFace Transformers:2 月 8 日合入 GlmMoeDsa 模型架构支持,配置类 GlmMoeDsaConfig 明确指向 zai-org/GLM-5
vLLM:2 月 9 日合入 GLM 适配 PR(#34124),支持推理部署
GitHub:zai-org 组织已有 GLM-4.5、GLM-V、GLM-OCR、GLM-Image 等多个开源仓库
预期开源
GLM-5 预计将以 MIT License 发布开源权重,延续 GLM-4.7 的开源传统。MIT 许可意味着完全自由的商用、微调和二次分发。开源后将可通过 HuggingFace、OpenRouter 等平台直接使用。
模型家族一览
智谱近期密集发布了多个模型:
GLM-5:745B MoE 旗舰,对标 GPT-5 / Claude Opus 4.6
GLM-4.7:上代旗舰,已是 Unsloth 平台下载量最高的模型之一
GLM-OCR:0.9B 参数文档理解模型,3,832 赞,SOTA 级别
GLM-Image:自回归图像生成
GLM-V 系列:多模态视觉语言模型(4.6V / 4.5V)
定价:价格屠夫的传统
GLM-4.x 系列 API 定价约 $0.11/百万 token,仅为 GPT-5 输入价格($1.25/M)的不到 1/10。
GLM-5 预计延续极低定价路线 + 开源权重双管齐下的策略。如果 MIT 开源兑现,企业可以零成本私有部署,这对 OpenAI 和 Anthropic 的商业模式构成直接压力。
同日三连发:中国 AI 的集体冲刺
2 月 11 日这一天,不只是智谱。三家中国 AI 公司选择在同一天放出旗舰模型:
智谱 GLM-5
745B MoE,华为昇腾训练,Agent + 编码
MiniMax M2.5
跳过 M2.2 直接发布,MoE 架构旗舰
DeepSeek V4
DeepSeek 新一代旗舰模型
有人指出:下周就是农历新年,各家都在赶在假期前发布。但这种「扎堆发布」本身就说明了竞争的白热化。
港股两日暴涨 60%
智谱 AI(知识图谱,港交所:2513)于 2026 年 1 月 8 日在港交所上市,IPO 募资约 43.5 亿港元(~5.58 亿美元),是「大模型第一股」。
受 GLM-5 架构曝光和 Pony Alpha 测试消息刺激,智谱股价两日暴涨 60%。唐杰教授在上市内部信中明确表示「即将推出 GLM-5」,并宣布设立新部门。资本市场对这款模型的预期极为强烈。
社区热议:推特上怎么说?
@Zai_org(官方)
「A new model is now available on z.ai」——1,919 赞,178K 浏览。随后发推称「用户流量暴涨 10 倍」。
@BrogrammerMW
「以 Pony Alpha 身份测试了一周。GLM-5 和 Claude Code Opus 4.6 之间的差距已经非常小了。」
@MikelEcheve
「745B MoE 旗舰,为聊天、编码和 Agent 任务设计。早期基准测试显示,正在与 GPT-5.3 和 Claude Opus 4.6 正面竞争。」
@laozhang2579
「DeepSeek、GLM、MiniMax 同一个晚上发布,通义千问是不是也快了?」
观察与思考
1. 架构趋同:GLM-5 采用 DeepSeek-V3 同款的 MoE + DSA + MTP 架构,说明中国 AI 社区的技术共享和迭代速度远超预期。架构不再是壁垒,数据和工程能力才是。
2. 开源是武器:GLM 全系列 MIT 开源的策略,让开发者可以零成本使用和部署。当 GPT-5 收费 $1.25/M token 时,GLM-5 的 API 可能只要 $0.1,开源后甚至免费。
3. 国产算力可行:745B 模型在华为昇腾上完成训练,证明国产芯片已经跨过了前沿模型训练的门槛。
4. 集体冲刺:一天三款旗舰模型(GLM-5 / MiniMax M2.5 / DeepSeek V4),中国 AI 已从「追赶者」变成「平行竞争者」。
参考来源
Z.ai 官方发布推文
HuggingFace Transformers GlmMoeDsa 文档
vLLM GLM 适配 PR #34124
36氪:GLM-5 架构曝光,智谱两日涨 60%
AIBase:匿名模型 Pony Alpha 身份揭秘
© 2026 AI Insight · 机智流
本文由 Intern-S1-Pro AI + 闻星 Vincent Skills 采集信息生成,可能有误