智谱 GLM-5 发布观察:745B MoE、华为芯片训练、港股暴涨 60%

机智流 2026-02-11 22:38

AI INSIGHT · 深度观察

由 AI 收集生成,可能有幻觉未全文校正

可能未来资讯拼的可信度是另一方面,欢迎批评

2026 年 2 月 11 日

智谱 GLM-5 发布观察:745B MoE、华为芯片训练、港股暴涨 60%图1

2 月 11 日,智谱 AI(Z.ai)正式发布第五代大语言模型 GLM-5。这款 745B 参数的 MoE 架构模型,在发布首日就引发 Z.ai 平台流量暴涨 10 倍,此前以「Pony Alpha」的匿名身份在 OpenRouter 上悄然测试一周,被社区发现后智谱港股两日暴涨 60%。

同日,DeepSeek V4 和 MiniMax M2.5 也密集发布——春节前夕的中国 AI 军团,正在集体冲刺。

           架构解剖:745B 参数的 MoE 巨兽         

745B

总参数量

44B

单次激活参数

256

专家数量

202K

上下文窗口

核心架构特征

MoE 架构:256 个路由专家 + 1 个共享专家,每个 token 激活 8 个专家(稀疏度 5.9%)
稀疏注意力(DSA):采用与 DeepSeek-V3 同款的 Lightning Indexer,仅对 Top-k 个相关 token 计算注意力
多 Token 预测(MTP):同时预测多个后续 token,显著提升生成效率
MLA 注意力压缩:KV LoRA Rank 512,Q LoRA Rank 2048,大幅降低 KV Cache 内存
78 层 Transformer:隐藏维度 6144,词表大小 154,880           

与上一代对比

             GLM-4.7(上一代旗舰)约 355B 参数 / 12B 激活。GLM-5 总参数翻倍至 745B,激活参数从 12B 跃升至 44B,是一次全面的规模跃迁。           

           「Pony Alpha」悬疑:一匹马引发的 AI 侦探大戏         

             2 月 6 日,一个名为「Pony Alpha」的匿名模型突然出现在 OpenRouter 平台上,标注为来自「前沿实验室的隐身模型」,免费使用,200K 上下文。           

首日即爆:处理超 400 亿 token,收到 20.6 万次请求。           

社区很快开始「破案」:

线索一:系统提示测试时,模型自报身份「I'm GLM」
线索二:Tokenizer 行为与 GLM-4 系列完全吻合
线索三:「Pony」是马,2026 年是马年——智谱的生肖彩蛋
线索四:发布时间恰好与智谱春节前发新模型的预告吻合
线索五:在敏感话题上的审查行为与国产模型一致           

           开发者 Marcus Wade 在正式发布前一周就用 Pony Alpha 做实际编码工作,评价:「GLM-5 与 Claude Code Opus 4.6 之间的差距已经非常小了。」他在 Claude Code 和 Kilo Code 环境中实测,认为 GLM-5 在编码和 Agent 能力上已达到一线水准。         

           全华为芯片训练:国产算力里程碑         

             GLM-5 完全使用华为昇腾芯片 + MindSpore 框架训练,实现了对美国制造半导体硬件的零依赖。这是迄今为止使用国产算力训练的最大规模前沿模型之一。           

             此前,智谱的 GLM-Image 也已在华为硬件上完成训练。随着美国芯片出口管制收紧,智谱正在证明:国产算力栈已经具备训练世界级大模型的能力。           

           GitHub + HuggingFace 生态布局         

已开源

HuggingFace Transformers:2 月 8 日合入 GlmMoeDsa 模型架构支持,配置类 GlmMoeDsaConfig 明确指向 zai-org/GLM-5
vLLM:2 月 9 日合入 GLM 适配 PR(#34124),支持推理部署
GitHubzai-org 组织已有 GLM-4.5、GLM-V、GLM-OCR、GLM-Image 等多个开源仓库           

预期开源

             GLM-5 预计将以 MIT License 发布开源权重,延续 GLM-4.7 的开源传统。MIT 许可意味着完全自由的商用、微调和二次分发。开源后将可通过 HuggingFace、OpenRouter 等平台直接使用。           

模型家族一览

             智谱近期密集发布了多个模型:
GLM-5:745B MoE 旗舰,对标 GPT-5 / Claude Opus 4.6
GLM-4.7:上代旗舰,已是 Unsloth 平台下载量最高的模型之一
GLM-OCR:0.9B 参数文档理解模型,3,832 赞,SOTA 级别
GLM-Image:自回归图像生成
GLM-V 系列:多模态视觉语言模型(4.6V / 4.5V)           

           定价:价格屠夫的传统         

             GLM-4.x 系列 API 定价约 $0.11/百万 token,仅为 GPT-5 输入价格($1.25/M)的不到 1/10。           

             GLM-5 预计延续极低定价路线 + 开源权重双管齐下的策略。如果 MIT 开源兑现,企业可以零成本私有部署,这对 OpenAI 和 Anthropic 的商业模式构成直接压力。           

           同日三连发:中国 AI 的集体冲刺         

           2 月 11 日这一天,不只是智谱。三家中国 AI 公司选择在同一天放出旗舰模型:         

智谱 GLM-5

745B MoE,华为昇腾训练,Agent + 编码

MiniMax M2.5

跳过 M2.2 直接发布,MoE 架构旗舰

DeepSeek V4

DeepSeek 新一代旗舰模型

           有人指出:下周就是农历新年,各家都在赶在假期前发布。但这种「扎堆发布」本身就说明了竞争的白热化。         

           港股两日暴涨 60%         

             智谱 AI(知识图谱,港交所:2513)于 2026 年 1 月 8 日在港交所上市,IPO 募资约 43.5 亿港元(~5.58 亿美元),是「大模型第一股」。           

             受 GLM-5 架构曝光和 Pony Alpha 测试消息刺激,智谱股价两日暴涨 60%。唐杰教授在上市内部信中明确表示「即将推出 GLM-5」,并宣布设立新部门。资本市场对这款模型的预期极为强烈。           

           社区热议:推特上怎么说?         

@Zai_org(官方)

「A new model is now available on z.ai」——1,919 赞,178K 浏览。随后发推称「用户流量暴涨 10 倍」。

@BrogrammerMW

「以 Pony Alpha 身份测试了一周。GLM-5 和 Claude Code Opus 4.6 之间的差距已经非常小了。」

@MikelEcheve

「745B MoE 旗舰,为聊天、编码和 Agent 任务设计。早期基准测试显示,正在与 GPT-5.3 和 Claude Opus 4.6 正面竞争。」

@laozhang2579

「DeepSeek、GLM、MiniMax 同一个晚上发布,通义千问是不是也快了?」

           观察与思考         

1. 架构趋同:GLM-5 采用 DeepSeek-V3 同款的 MoE + DSA + MTP 架构,说明中国 AI 社区的技术共享和迭代速度远超预期。架构不再是壁垒,数据和工程能力才是。           

2. 开源是武器:GLM 全系列 MIT 开源的策略,让开发者可以零成本使用和部署。当 GPT-5 收费 $1.25/M token 时,GLM-5 的 API 可能只要 $0.1,开源后甚至免费。           

3. 国产算力可行:745B 模型在华为昇腾上完成训练,证明国产芯片已经跨过了前沿模型训练的门槛。           

4. 集体冲刺:一天三款旗舰模型(GLM-5 / MiniMax M2.5 / DeepSeek V4),中国 AI 已从「追赶者」变成「平行竞争者」。           

           参考来源         

             Z.ai 官方发布推文
             HuggingFace Transformers GlmMoeDsa 文档
             vLLM GLM 适配 PR #34124
             36氪:GLM-5 架构曝光,智谱两日涨 60%
             AIBase:匿名模型 Pony Alpha 身份揭秘           

© 2026 AI Insight · 机智流

本文由 Intern-S1-Pro AI + 闻星 Vincent Skills 采集信息生成,可能有误

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
芯片 华为
more
华为OPPO入局!iPhone这招太狠了
奕境首款大六座SUV极寒测试曝光,华为乾崑技术加持验证极限可靠性
华为nova 16系列或将首发1:1方形前摄,聚焦竖拍横图新体验
Omdia:2025年第三季度,中国大陆云基础设施市场加速增长24%,阿里云继续保持领先地位,华为云和腾讯云紧随其后
小米首入前十超越华为,拼多多稳居第六——2025胡润中国500强揭示新质生产力驱动格局
国产HDMI 2.1协议分析仪SA8231交付华为,实现全链路自主可控
城市NOA加速普及,自主品牌主导市场,华为与Momenta领跑第三方供应格局
1.55亿华为昇腾大单定了!1.6P算力,中国移动中标
华为Pura X2最新曝出,首台“阔大折”
华为Mate 80,逆袭夺第一
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号