智谱 GLM-5 发布观察：745B MoE、华为芯片训练、港股暴涨 60%

AI INSIGHT · 深度观察

由 AI 收集生成，可能有幻觉未全文校正

可能未来资讯拼的可信度是另一方面，欢迎批评

2026 年 2 月 11 日

智谱 GLM-5 发布观察：745B MoE、华为芯片训练、港股暴涨 60%图1

2 月 11 日，智谱 AI（Z.ai）正式发布第五代大语言模型 GLM-5。这款 745B 参数的 MoE 架构模型，在发布首日就引发 Z.ai 平台流量暴涨 10 倍，此前以「Pony Alpha」的匿名身份在 OpenRouter 上悄然测试一周，被社区发现后智谱港股两日暴涨 60%。

同日，DeepSeek V4 和 MiniMax M2.5 也密集发布——春节前夕的中国 AI 军团，正在集体冲刺。

架构解剖：745B 参数的 MoE 巨兽

745B

总参数量

44B

单次激活参数

256

专家数量

202K

上下文窗口

核心架构特征

MoE 架构：256 个路由专家 + 1 个共享专家，每个 token 激活 8 个专家（稀疏度 5.9%）
稀疏注意力（DSA）：采用与 DeepSeek-V3 同款的 Lightning Indexer，仅对 Top-k 个相关 token 计算注意力
多 Token 预测（MTP）：同时预测多个后续 token，显著提升生成效率
MLA 注意力压缩：KV LoRA Rank 512，Q LoRA Rank 2048，大幅降低 KV Cache 内存
78 层 Transformer：隐藏维度 6144，词表大小 154,880

与上一代对比

GLM-4.7（上一代旗舰）约 355B 参数 / 12B 激活。GLM-5 总参数翻倍至 745B，激活参数从 12B 跃升至 44B，是一次全面的规模跃迁。

「Pony Alpha」悬疑：一匹马引发的 AI 侦探大戏

2 月 6 日，一个名为「Pony Alpha」的匿名模型突然出现在 OpenRouter 平台上，标注为来自「前沿实验室的隐身模型」，免费使用，200K 上下文。

首日即爆：处理超 400 亿 token，收到 20.6 万次请求。

社区很快开始「破案」：

线索一：系统提示测试时，模型自报身份「I'm GLM」
线索二：Tokenizer 行为与 GLM-4 系列完全吻合
线索三：「Pony」是马，2026 年是马年——智谱的生肖彩蛋
线索四：发布时间恰好与智谱春节前发新模型的预告吻合
线索五：在敏感话题上的审查行为与国产模型一致

开发者 Marcus Wade 在正式发布前一周就用 Pony Alpha 做实际编码工作，评价：「GLM-5 与 Claude Code Opus 4.6 之间的差距已经非常小了。」他在 Claude Code 和 Kilo Code 环境中实测，认为 GLM-5 在编码和 Agent 能力上已达到一线水准。

全华为芯片训练：国产算力里程碑

GLM-5 完全使用华为昇腾芯片 + MindSpore 框架训练，实现了对美国制造半导体硬件的零依赖。这是迄今为止使用国产算力训练的最大规模前沿模型之一。

此前，智谱的 GLM-Image 也已在华为硬件上完成训练。随着美国芯片出口管制收紧，智谱正在证明：国产算力栈已经具备训练世界级大模型的能力。

GitHub + HuggingFace 生态布局

已开源

HuggingFace Transformers：2 月 8 日合入 GlmMoeDsa 模型架构支持，配置类 GlmMoeDsaConfig 明确指向 zai-org/GLM-5
vLLM：2 月 9 日合入 GLM 适配 PR（#34124），支持推理部署
GitHub：zai-org 组织已有 GLM-4.5、GLM-V、GLM-OCR、GLM-Image 等多个开源仓库

预期开源

GLM-5 预计将以 MIT License 发布开源权重，延续 GLM-4.7 的开源传统。MIT 许可意味着完全自由的商用、微调和二次分发。开源后将可通过 HuggingFace、OpenRouter 等平台直接使用。

模型家族一览

智谱近期密集发布了多个模型：
GLM-5：745B MoE 旗舰，对标 GPT-5 / Claude Opus 4.6
GLM-4.7：上代旗舰，已是 Unsloth 平台下载量最高的模型之一
GLM-OCR：0.9B 参数文档理解模型，3,832 赞，SOTA 级别
GLM-Image：自回归图像生成
GLM-V 系列：多模态视觉语言模型（4.6V / 4.5V）

定价：价格屠夫的传统

GLM-4.x 系列 API 定价约 $0.11/百万 token，仅为 GPT-5 输入价格（$1.25/M）的不到 1/10。

GLM-5 预计延续极低定价路线 + 开源权重双管齐下的策略。如果 MIT 开源兑现，企业可以零成本私有部署，这对 OpenAI 和 Anthropic 的商业模式构成直接压力。

同日三连发：中国 AI 的集体冲刺

2 月 11 日这一天，不只是智谱。三家中国 AI 公司选择在同一天放出旗舰模型：

智谱 GLM-5

745B MoE，华为昇腾训练，Agent + 编码

MiniMax M2.5

跳过 M2.2 直接发布，MoE 架构旗舰

DeepSeek V4

DeepSeek 新一代旗舰模型

有人指出：下周就是农历新年，各家都在赶在假期前发布。但这种「扎堆发布」本身就说明了竞争的白热化。

港股两日暴涨 60%

智谱 AI（知识图谱，港交所：2513）于 2026 年 1 月 8 日在港交所上市，IPO 募资约 43.5 亿港元（~5.58 亿美元），是「大模型第一股」。

受 GLM-5 架构曝光和 Pony Alpha 测试消息刺激，智谱股价两日暴涨 60%。唐杰教授在上市内部信中明确表示「即将推出 GLM-5」，并宣布设立新部门。资本市场对这款模型的预期极为强烈。

社区热议：推特上怎么说？

@Zai_org（官方）

「A new model is now available on z.ai」——1,919 赞，178K 浏览。随后发推称「用户流量暴涨 10 倍」。

@BrogrammerMW

「以 Pony Alpha 身份测试了一周。GLM-5 和 Claude Code Opus 4.6 之间的差距已经非常小了。」

@MikelEcheve

「745B MoE 旗舰，为聊天、编码和 Agent 任务设计。早期基准测试显示，正在与 GPT-5.3 和 Claude Opus 4.6 正面竞争。」

@laozhang2579

「DeepSeek、GLM、MiniMax 同一个晚上发布，通义千问是不是也快了？」

观察与思考

1. 架构趋同：GLM-5 采用 DeepSeek-V3 同款的 MoE + DSA + MTP 架构，说明中国 AI 社区的技术共享和迭代速度远超预期。架构不再是壁垒，数据和工程能力才是。

2. 开源是武器：GLM 全系列 MIT 开源的策略，让开发者可以零成本使用和部署。当 GPT-5 收费 $1.25/M token 时，GLM-5 的 API 可能只要 $0.1，开源后甚至免费。

3. 国产算力可行：745B 模型在华为昇腾上完成训练，证明国产芯片已经跨过了前沿模型训练的门槛。

4. 集体冲刺：一天三款旗舰模型（GLM-5 / MiniMax M2.5 / DeepSeek V4），中国 AI 已从「追赶者」变成「平行竞争者」。

参考来源

Z.ai 官方发布推文
HuggingFace Transformers GlmMoeDsa 文档
vLLM GLM 适配 PR #34124
36氪：GLM-5 架构曝光，智谱两日涨 60%
AIBase：匿名模型 Pony Alpha 身份揭秘

本文由 Intern-S1-Pro AI + 闻星 Vincent Skills 采集信息生成，可能有误