天天卖断货的 GLM-5.2,用起来到底值不值?

差评X.PIN 2026-06-18 00:12
天天卖断货的 GLM-5.2,用起来到底值不值?图1



天天卖断货的 GLM-5.2,用起来到底值不值?图2 说实话,一开始你和我说国产模型能比肩 Claude、GPT,我是拒绝的。


但是在世超蹲了三天,终于抢到了智谱的 Coding Plan 套餐,高强度蹬了两轮 token 之后。

天天卖断货的 GLM-5.2,用起来到底值不值?图3


天天卖断货的 GLM-5.2,用起来到底值不值?图4 发现这事好像真有点说法。。。


众所周知,前几天 Anthropic 又开始整活了,模型发的好好的,突然举起了 “ 安全 ” 的大旗,把上线刚几天的最强模型 Fable 5 给禁用了。

天天卖断货的 GLM-5.2,用起来到底值不值?图5


而就在这么个大家伙怨声载道的节骨眼,智谱出手了。


天天卖断货的 GLM-5.2,用起来到底值不值?图6 早上刚起来 Claude 发的禁令,下午智谱就用新模型的发布做为回应。

天天卖断货的 GLM-5.2,用起来到底值不值?图7


到今天更是一步到位,直接开放权重了,而且支持的还是最宽松的 MIT 协议,这意味着大家伙不但可以直接拿来自己用,还可以在它的基础上继续修改和商用。


天天卖断货的 GLM-5.2,用起来到底值不值?图8 而且同时还和国产的算力打了一波配合,直接和华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞这些国产算力平台完成了推理适配。

天天卖断货的 GLM-5.2,用起来到底值不值?图9


其实平时不太倒腾大模型的差友,可能对智谱这家略显低调的公司没啥概念。


天天卖断货的 GLM-5.2,用起来到底值不值?图10 但你要是去程序员扎堆的群里吼一嗓子,就知道上一代 GLM-5.1 的含金量有多高了,大家基本是一片好评,而差评则主要集中在两个方面。


一个是抢不到,这玩意比演唱会的门牌还难抢,每天早上十点钟准时刷新,能不能买到全凭手速。。。


第二个问题是模型的上下文长度只支持到了 256k,这就导致但如果你用它干点稍微复杂的活,上下文一被塞满,模型的能力就会有所下降。


而这次 GLM-5.2 的更新就把这个问题给很大的弥补了一波,痛定思痛,直接干到了百万上下文。

天天卖断货的 GLM-5.2,用起来到底值不值?图11


天天卖断货的 GLM-5.2,用起来到底值不值?图12 从几个最核心的长程任务跑分来看,GLM-5.2 这次的走位极其风骚,综合硬实力卡在了 Claude Opus 4.7 和 4.8 之间。


天天卖断货的 GLM-5.2,用起来到底值不值?图13


这还只是个开胃菜。虽然大伙现在对各种 AI 榜单多少有点脱敏,知道跑分只能当个参考,但尽管如此,GLM-5.2 这次的跑分看起来还是有些夸张了。


天天卖断货的 GLM-5.2,用起来到底值不值?图14 就这么说吧,在经典的全球用户盲评的大模型竞技场 Code Arena 上,GLM 5.2 直接拿下了能用上的模型里,全球第一的位置。。。


分数要比它还高的,就只有前几天被禁用了的 Claude Fable 5。

天天卖断货的 GLM-5.2,用起来到底值不值?图15


天天卖断货的 GLM-5.2,用起来到底值不值?图16 在 Artificial Analysis 这里,智谱的表现也仅次于 Claude 和 OpenAI 两家。

天天卖断货的 GLM-5.2,用起来到底值不值?图17


天天卖断货的 GLM-5.2,用起来到底值不值?图18 当然,跑分再高也只能做个参考,为了看看它是不是一个只会刷题的小镇做题家,世超把它直接拉出来测了一波。


先来个简单的题目开开胃,和前几天测试 Fable 时一样,我们让它先做了个旋转小球的游戏来尝尝咸淡。


编写一个 Python 程序,展示一个球在旋转的六边形内弹跳,六边形中只有五边是墙壁,其中一边是可通过的,小球碰到墙壁的时候自动分裂成两个,或者是穿过可通过的边界掉落到地图外面,球的运动轨迹应受到重力的影响,并且必须真实地反弹到旋转的墙壁上。 在界面的左下角显示总共生成的小球数量,当所有小球都掉落到界面外面的时候,游戏结束,玩家可以重新开始游戏。


智谱做这题的思路倒是和 Fable 很像,没有和 GPT 一样做一堆花里胡哨的动效。


GPT 做的小球,加上了华丽的特效拖尾。

天天卖断货的 GLM-5.2,用起来到底值不值?图19


而是考虑到小球数量太多会影响性能的情况,限制了屏幕里 “ 当前小球 ” 的最大数量。


等前面的小球掉下去了之后,后面的小球还会继续生成。


GLM-5.2在 Claude Code 里做的效果

天天卖断货的 GLM-5.2,用起来到底值不值?图20


天天卖断货的 GLM-5.2,用起来到底值不值?图21 同时在没有任何提示的情况下,给这个小游戏用上了中文的 UI。

天天卖断货的 GLM-5.2,用起来到底值不值?图22


天天卖断货的 GLM-5.2,用起来到底值不值?图23 最近不是世界杯嘛,让它来做个点球模拟器也不在话下:

天天卖断货的 GLM-5.2,用起来到底值不值?图24


GLM-5.2 一次性直接把整个 3D 游戏给做了出来,玩起来倒是没啥问题,就是进球的判定有点宽松,世超有几轮看着球碰到了守门员,结果这球直接一个虚化遁入球门。

天天卖断货的 GLM-5.2,用起来到底值不值?图25


天天卖断货的 GLM-5.2,用起来到底值不值?图26 而 Claude Opus 4.8 做的就有点抽象了,虽然人做了个进球时的镜头跟随,但是它这程序直接做出 bug 来了,球一旦进了球门就会直接卡死。。。

天天卖断货的 GLM-5.2,用起来到底值不值?图27


至少在编程项目的逻辑这块,世超用下来并没有和 4.8 差太多。。。


当然,除了这些小游戏小 Demo,让它来做一些复杂的项目迁移也不是问题。


天天卖断货的 GLM-5.2,用起来到底值不值?图28 就比如最近世超在 Github 上刷到了一个蛮好玩的 AI 自动小说续写项目,你可以自己捏人设、定世界观,然后跟 AI 互动往下走剧情。


在电脑上盘了几天后,世超更是手痒了,感觉这种东西更适合放在手机上跑,抓住各种碎片化时间来聊两句,于是就琢磨着能不能把这玩意儿直接整个本地化移植,搬到手机上跑,给自己过一把作家瘾。

天天卖断货的 GLM-5.2,用起来到底值不值?图29


最开始准备拿 CodeX 来做个项目迁移,把原本的电脑项目给转到手机上。


天天卖断货的 GLM-5.2,用起来到底值不值?图30 结果没想到 Codex 上来就是一个否认三连,先是认为现在这个项目的本体是个前后端分别运行的项目,不适合搬到手机上跑。

天天卖断货的 GLM-5.2,用起来到底值不值?图31


然后又说认为这个项目如果重构的话会非常费劲,建议我只在手机上重构前端界面,然后再买个服务器,注册个域名来做后端业务。。。

天天卖断货的 GLM-5.2,用起来到底值不值?图32


天天卖断货的 GLM-5.2,用起来到底值不值?图33 ?不是哥们,都 2026 年了,遇到点代码上的硬骨头,第一反应居然是让我加钱买服务器? AI 还教起我做事了?


气得我反手就把一模一样的原话糊到了 GLM 的对话框里。


事实证明,在这事儿上,GLM 确实没 GPT 那么老油条。


天天卖断货的 GLM-5.2,用起来到底值不值?图34 人家根本没跟你扯什么退而求其次的替代方案,简单梳理了几句上下文,二话不说直接在后台拉起了三个 Agent,兵分三路直接扎进代码库里,实打实地去探究这玩意儿到底该怎么做底层的本地化迁移了。主打一个主观能动性拉满。

天天卖断货的 GLM-5.2,用起来到底值不值?图35


没多久就找到了 CodeX 没注意到的解决办法,帮我把这玩意在手机上跑起来扫平了障碍。

天天卖断货的 GLM-5.2,用起来到底值不值?图36


天天卖断货的 GLM-5.2,用起来到底值不值?图37 更让人蚌埠住的是,当我把 GLM5.2 的解决方案发给 CodeX 之后,它直接原地道歉,然后开始反思自己为啥没想到这招。。。

天天卖断货的 GLM-5.2,用起来到底值不值?图38


天天卖断货的 GLM-5.2,用起来到底值不值?图39 然后在经过了漫长的开发和迁移之后,很快 GLM-5.2 就把这个应用给搬到了 IOS 手机上。

天天卖断货的 GLM-5.2,用起来到底值不值?图40


开发中的过程还很有意思,众所周知,这次的 GLM 5.2 算是一个编程偏科的模型,并没有图像识别这种多模态能力。


按理说,这就意味着它没法像那些自带视觉的全能模型一样,遇到前端 UI 卡壳的时候,自己瞅一眼截图,看看排版问题到底出在哪里。


但是智谱的工程师想了个奇妙小连招来帮忙过度了一下。


天天卖断货的 GLM-5.2,用起来到底值不值?图41 真到了那种需要看图才能 Debug 的环节,智谱不会原地摆烂等人类来帮忙接管,而是会在后台悄咪咪地把图片外包出去。


直接发射给另一个专门负责视觉的识图模型。等这位视觉兄弟看完图、把里面的关键信息嚼碎了提取出来,再转手反哺给 GLM-5.2。

天天卖断货的 GLM-5.2,用起来到底值不值?图42


天天卖断货的 GLM-5.2,用起来到底值不值?图43 俩大模型直接在后台打了一波完美的辅助加输出配合,属于是把 GLM-5.2 目前还没有多模态能力的缺点给盘活了一部分。


但可惜的是也只盘活了一部分,和那些原生多模态的模型比起来,5.2 做出来的软件 UI 还是稍微差了一点意思。


天天卖断货的 GLM-5.2,用起来到底值不值?图44 比如这个小说自动续写项目,虽然最后世超把它成功给搬到了 IOS 上了。各种功能用起来也没啥 bug,逻辑都没出问题,但就是 UI 显的有些拥挤了,各种按钮和文本框挤得简直跟上下班早高峰时的秋石高架一样的。。。


这块想要做好,可能就需要我们能工智人来和 AI 好好的再配合一波了。

天天卖断货的 GLM-5.2,用起来到底值不值?图45


除此之外,这次体验下来,世超也能很明显的感觉到,或许是因为国产大模型厂商缺显卡的原因,GLM-5.2 运行起来的速度算不上快。


咱们最开头提到的那个旋转六边形的 Demo,之前世超不管是用 Claude 还是 GPT,基本上只要三分钟就能做完。


天天卖断货的 GLM-5.2,用起来到底值不值?图46 但到了智谱这里,做了整整十三分钟。

天天卖断货的 GLM-5.2,用起来到底值不值?图47


后面跑的几个测试 Demo,也是一不留神就会直接跑个三四十分钟。


很明显能感受到,这些国产的大模型厂商还是缺算力的。

天天卖断货的 GLM-5.2,用起来到底值不值?图48


天天卖断货的 GLM-5.2,用起来到底值不值?图49 可能也正是这个原因,才导致智谱的 Coding Plan 一直那么难抢了。


最后,世超对 GLM-5.2 的感觉还是挺复杂的。


好不容易买到了订阅之后,用了一天就快蹬完了周额度的 50%。

天天卖断货的 GLM-5.2,用起来到底值不值?图50


整体体验下来你要说它已经全面超越 Claude、GPT,那肯定有点吹过头了。


天天卖断货的 GLM-5.2,用起来到底值不值?图51 目前的 GLM-5.2 只能说在纯编码这块能和这些世界顶级的闭源模型来打个五五开。


但是要真的把一个项目做到完美,只靠编码这一个长板是不够的。


但是仔细看下来,这些事情很多又不是智谱的问题,甚至也不是智谱一家的问题。


天天卖断货的 GLM-5.2,用起来到底值不值?图52 罗马不是一天建成的,国产模型要补齐多模态生态和底层算力的短板也得慢慢熬。


前几天智谱宣布发布 GLM-5.2 的文章开头,提到了两句话:


前沿智能不应只属于少数人,也不应被少数规则随时收回


它应该开放、可用、可构建,并服务于每一位开发者。


世超觉得说的很对。


而且他们今天,也做到了。



撰文:早起
编辑:江江 & 面线
美编:素描

图片、资料来源:GLM 官网,X、https://github.com/alfredxw/nova



天天卖断货的 GLM-5.2,用起来到底值不值?图53

天天卖断货的 GLM-5.2,用起来到底值不值?图54

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
【智造】精益管理是企业走向智能制造的基石吗?
2025年度智能制造系统解决方案“揭榜挂帅”项目申报工作启动
【智造】93%的制造企业认为全面AI将形成压倒性优势!毕马威最新报告揭示智能制造成熟度三阶段
重量级活动报名!「东湖论坛•2025国际智能制造创新论坛」10月15日武汉光谷开启
【智造】智能制造“三步走”,发展范式深度解析
具身智能下半场:南方阵营的崛起
中高档乘用车大型精密覆盖件模具智能制造升级扩产项目可行性研究报告
金升阳科技:创新电源技术,为智能制造注入强劲动力!
智能制造工程师培训课程(高级)报名ing!
【智造】机器人造机器人:智能制造迎来魔幻时刻!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号