智谱GLM-5技术全公开,以“智能体工程”重塑大模型能力边界

科技区角 2026-02-23 11:00

【区角快讯】曾因单日股价飙升42%而被冠以“全球大模型第一股”的智谱正式发布GLM-5技术报告,全面披露其底层架构与创新细节,直接回应外界关于“套壳”或“蒸馏海外模型”的质疑。

该报告明确指出,GLM-5定位为推动编程范式由“Vibe Coding”(氛围编程)向“Agentic Engineering”(智能体工程)演进的下一代基础模型,其性能跃升主要依托四大核心技术突破。

首先,模型引入DeepSeek稀疏注意力机制(DSA),取代此前GLM-4.5所采用的标准MoE架构。该机制能依据Token的重要性动态分配计算资源,在不牺牲长上下文理解与推理深度的前提下,显著降低训练与推理的算力消耗。得益于此,GLM-5参数规模扩展至7440亿,训练数据量达28.5万亿Token。

其次,智谱构建了全新的异步强化学习(RL)基础设施。在延续GLM-4.5时期“slime框架”中训练与推理解耦思路的基础上,新系统进一步实现生成与训练流程的深度分离,极大提升GPU利用率,并支持大规模智能体轨迹探索,有效缓解同步训练带来的效率瓶颈。

在上述基础上,团队研发出一种新型异步Agent强化学习算法。相较于GLM-4.5依赖迭代自蒸馏与结果监督的方式,新算法使模型能在多样化、长周期的交互环境中持续优化自主决策、动态规划及自我纠错能力,从而在真实软件工程任务中展现卓越表现。

另外,GLM-5从设计之初即全面适配国产算力生态。通过与华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯及燧原等七大国产芯片平台深度协同,完成从底层内核到上层推理框架的全栈优化。此举不仅克服了异构硬件部署的复杂性,更使单节点国产设备性能媲美双卡国际主流GPU集群,长序列处理成本降低50%。

尤为引人注目的是,智谱在OpenRouter平台曾以代号“PonyAlpha”匿名上线GLM-5,开展盲测实验。此举虽具风险,却收获社区高度认可。上线数日内,开发者普遍惊叹其在复杂代码生成、Agent任务链及角色扮演中的强大能力。最终盲测结果上,25%认为是Claude Sonnet 5,20%指向Grok新版本,10%猜为DeepSeek V4,其余则准确识别为GLM-5。身份揭晓后,该测试被视为对本土模型技术实力的有力正名。

目前,GLM-5不仅在Artificial Analysis榜单位列全球第四、开源第一,更在SWE-bench-Verified与TerminalBench 2.0分别取得77.8和56.2的开源最高分,超越Gemini 3 Pro。其在内部ClaudeCode评估中,前端、后端及长程任务表现较GLM-4.7平均提升超20%,使用体验逼近Claude Opus 4.5。

当前,行业共识正从“会写代码”转向“能完成系统级工程”,而GLM-5正是这一范式迁移的关键载体。它不再仅为演示而生,而是面向生产环境稳定交付的“系统架构师”。

在全球AI竞争格局中,如果说字节跳动的Seedance 2.0展现了中国AI的创意想象力,那么GLM-5则彰显了其扎实的工程执行力。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
大模型
more
全球最大游戏博主「偷师」DeepSeek,爆改国产大模型干翻 ChatGPT
英伟达被起诉,用盗版训练大模型成行业潜规则?
Seedance 2.0爆火致排队超8小时 官方回应算力瓶颈与版权审核机制
阶跃星辰冲刺港股IPO,拟成中国第三家上市大模型企业
DeepSeek之后,智源大模型登Nature:事关“世界模型”统治路线!
AI脑机接口大模型融合伦理:从ChatGPT到脑信号的语言革命
国产大模型同台PK:DeepSeek向左,Kimi向右,AI大升级来了?
刚刚,腾讯姚顺雨团队首个成果发布!揭示大模型真正瓶颈
DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑
Kimi K2.5正式开源,月之暗面推多模态全能大模型
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号