智谱GLM-4.5发布,中国 AI 正在崛起

智能情报所 2025-07-30 17:42

智谱发布GLM-4.5,又一个高效且顶尖的 AI 模型。

在 Meta 的 Llama 模型显得黯然失色的这一年,中国的开源 AI 模型却大放异彩,其光芒足以挑战美国在人工智能领域的霸主地位。

作者:PATRICK MCGUINNESS

日期:2025 年 7 月 30 日

资讯配图

图 1. GLM-4.5 一次就写出了一个打砖块游戏,上手体验很棒。

新一轮中国开源 AI 模型浪潮

中国的 AI 实验室最近可以说是火力全开。仅仅在 7 月,就涌现了多个杰出的 AI 模型:

  • 月之暗面 发布了 Kimi K2。
  • 阿里 Qwen 团队 更新了 Qwen-3 2507 系列模型。
  • 智谱 AI 发布了 GLM-4.5 和 GLM-4.5-Air。

Kimi K2 是一款很不错的模型,尤其在编程任务上,几乎达到了业界顶尖水平。

而 Qwen-3 系列,包括它的代码模型,表现更胜一筹。现在,GLM-4.5 的出现,又将标准提到了新的高度。

它是一款极为出色且高效的 AI 模型,在编程、推理、智能体任务等多个方面都游刃有余。

资讯配图

图 2. GLM-4.5 专注于在智能体、推理和编程等关键领域做到最好,并成功跻身顶级模型之列。更关键的是,它仅用 320 亿活跃参数就实现了这一点,运行效率极高。

GLM-4.5 的核心特性与实力

智谱 AI 的 GLM-4.5 是一款能力广泛的细粒度混合专家模型。

旗舰版的 GLM-4.5 模型拥有 3550 亿总参数和 320 亿活跃参数。同时发布的还有一个更小巧的 GLM-4.5-Air 模型,活跃参数仅为 120 亿。

这些模型都能在处理复杂任务的「思考模式」和用于快速聊天的「非思考模式」之间灵活切换。

GLM-4.5 专为智能体任务优化,效率奇高。它的使用成本甚至比 DeepSeek 还低,每百万输入 token 仅 11 美分,输出 token 仅 28 美分。

这个价格不仅低于 DeepSeek,甚至可以对标谷歌的 2.5 Flash-Lite。

但关键在于,你用几乎和 Gemini 2.5 Flash-Lite 一样的价格,却能享受到 Gemini 2.5 Pro 级别的顶级性能

在各项专业基准测试中,GLM-4.5 的表现足以证明其实力,其分数与 o3、Claude 4 Opus、Gemini 2.5 Pro 等业界顶尖模型不相上下。

当然,是骡子是马还得拉出来遛遛,GLM-4.5 需要在真实世界中接受更多检验。

但从团队公布的覆盖编程、推理、智能体等多个维度的全面测试数据来看,他们并非在玩选择性营销的把戏。

资讯配图

"图 3. AI 分析基准指数高达 67.7,优异的基准分数让 GLM-4.5 稳居顶级 AI 模型的第一梯队。")

尤其值得关注的是 GLM-4.5 在编程和作为智能体方面的表现。智谱 AI 团队提到:

GLM-4.5 是一个为智能体任务优化的基础模型,它支持 128k 的超长上下文和原生的函数调用能力。在两大权威智能体能力基准测试中,GLM-4.5 的表现与 Claude 4 Sonnet 并驾齐驱。

随着 AI 智能体的大规模应用,token 消耗量暴增,成本控制成为关键。

智能体应用迫切需要一款高性价比的 AI 模型。一个成本低廉、工具调用能力又强的模型,可能会彻底改变这个领域的游戏规则。

同样,最近这三款来自中国的 AI 模型,在编程方面的表现都堪称惊艳。

在 SWE-bench 代码能力测试中,它们的得分都非常接近当前该领域的领导者 Claude 4 Sonnet。

资讯配图

"图 4. 在同等规模下,GLM-4.5 和 GLM-4.5-Air 是最强大的开源代码模型,其综合实力已非常接近业界标杆 Claude 4 Sonnet。")

一位开发者 Daniel Vila Suero 在 X 平台上分享了他的体验:「在我的动画 SVG 上手测试中,它比 Kimi K2 好太多了。」

GLM-4.5 模型已经开源权重,可以在 HuggingFace 和 ModelScope 上找到。

虽然作为大型混合专家模型,普通电脑跑不动,但你可以在一台配备 128GB 内存的 M4 MacBook 上顺畅运行 GLM-4.5-Air。

你也可以通过 Z.ai 的官方 API 或 OpenRouter 等第三方平台来体验它。截至本文撰写时,OpenRouter 上的 GLM-4.5-Air 模型可以免费试用。

智谱 AI 的技术传承

智谱 AI (Z.ai) 脱胎于清华大学的知识工程实验室,这是一个在 AI 领域深耕多年的顶尖团队。

这个实验室自 2021 年起就开始打造 GLM 系列模型,并开源了大量代码、模型和数据。

在今年 4 月,他们发布的 GLM-4 32B 模型,性能就已经可以和 OpenAI 的 GPT 系列及 DeepSeek 的模型相媲美。

资讯配图

"图 5. 从 2021 年 3 月的初代模型到 2024 年 6 月,GLM 系列模型的演进之路。")

架构与技术细节揭秘

智谱 AI 和其他中国实验室的历史表明,他们在短短两年内取得了惊人的进步。

他们已经从模仿和追赶,转向在 AI 架构、训练和推理方面做出重要的原创性创新。

当美国的顶尖 AI 公司对前沿技术越来越讳莫如深的时候,中国的实验室却依然保持着开放和分享的态度。

在智谱 AI 的技术报告中,他们分享了 GLM-4.5 训练过程中的诸多细节。

这些新一代的中国模型,普遍采用了更高效的细粒度混合专家架构。

在训练阶段,模型首先学习了 15T token 的通用知识,再用 7T token 的代码和推理数据进行强化。

随后,团队通过一个被称为「中期训练」的阶段,用海量的代码、合成推理数据和智能体数据,对模型的专项技能进行精雕细琢。

资讯配图

"图 6. GLM-4.5 的预训练数据量不算巨大,但通过“中期训练”环节,精准地强化了核心能力。")

他们还大规模地应用了强化学习技术来突破模型的能力边界。

为此,他们开发了一套创新的两阶段训练后方法:先分别训练出推理、智能体、通用任务三个「专家模型」,再通过「自蒸馏」技术将所有能力融合回一个模型中,最后再进行多轮强化。

资讯配图

"图 7. 先分头培养专家,再集众家之长于一身,最终锤炼出全能的 GLM-4.5。")

“快速追随者”与中国 AI 的独特赛道

GLM-4.5 的强大实力,因其开源而更具价值。它让我们有机会一窥顶级模型的内部构造和训练方法,而这些正是那些闭源开发者从不分享的秘密。

这一系列发布不禁让我们思考:美国 AI 实验室的核心优势到底是什么?

如果说是算力硬件,DeepSeek 已经证明了中国团队能用更少的资源办更多的事。如果说是人才,全球各地涌现的优秀模型表明,顶尖人才并非少数公司所独有。

即使中国曾是追随者,他们也已成为最快的追随者。

更重要的是,通过更加开放地分享,整个 AI 领域得以加速前进,形成了一个良性的创新飞轮。每个团队都能从他人的成果中学习,从而更快地进步。

这种发展速度意味着,就算 OpenAI 的 GPT-5 未来技惊四座,或许只需 6 个月,我们就能看到来自中国的、成本更低、速度更快、性能同样出色的开源模型

当 AI 智能体进入大规模生产应用,成本将成为王道。

低成本、高效率、在代码和智能体任务上表现卓越——这正逐渐成为中国 AI 的独特优势和赛道。在一个由数十亿智能体构成的未来世界里,这样的模型将至关重要。

因此,中国的 AI 实验室及其最新模型,不仅是全球 AI 用户的福音,也对 OpenAI、谷歌和 Anthropic 等传统巨头构成了日益严峻的挑战。


一键三连点赞」「转发」「小心心

欢迎在评论区留下你的想法!


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
老师饭碗也不保了?OpenAI推出“ChatGPT学习模式”,AI教育争议不断
对话金山办公田然:有些AI PPT产品的续费率远低于及格线,原因是没有粘性
资讯 | 山东首个脑机接口临床与转化中心成立、江苏发布脑机接口医疗服务价格、神芯科技/CorTec/INBRAIN新进展
首亮相!华为超级AI算力系统真机实现多项突破
快讯|巨星传奇联合宇树科技开发IP消费级机器人;Skild AI发布通用机器人模型;强瑞技术布局人形机器人业务
学会活动丨AI-CAD项目获人工智能创新创业大赛一等奖,引领国产工业设计软件新纪元
星动纪元、宇树科技等新品亮相;RoboScience完成融资;机器人6S店开业;WAIC 2025具身智能成焦点
为何AI很火,落地工业却很难?究竟如何破局?
小米AI眼镜冲500万,淘汰赛开打!
论坛直击 | 世界人工智能大会AI开源论坛顺利举办——以开源为引擎,以人才为内核,上海构筑全球AI高地“双轮驱动”新格局
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号