智谱发布开源轻量级大模型GLM-4.7-Flash,聚焦高效部署与多场景应用

科技区角 2026-01-20 10:32

【科技纵览】1月20日,智谱AI正式推出并开源其最新轻量化大语言模型GLM-4.7-Flash。该模型采用混合思考架构,总参数规模达300亿,实际推理时仅激活30亿参数,旨在为边缘设备及资源受限环境提供高性能与高效率兼备的部署方案。



即日起,GLM-4.7-Flash将全面接替此前的GLM-4.5-Flash版本,在智谱开放平台BigModel.cn上线,并向开发者免费开放调用权限。据官方披露,在SWE-bench Verified与τ²-Bench等权威基准测试中,该模型综合得分超越gpt-oss-20b及Qwen3-30B-A3B-Thinking-2507,在同参数量级的开源模型中达到当前最优(SOTA)水平。

在内部实测中,GLM-4.7-Flash在前端与后端开发任务中均展现出优异能力。除编码场景外,智谱亦推荐用户将其应用于中文写作、跨语言翻译、长文本生成以及情感表达和角色扮演等通用人工智能任务。

值得注意的是,旧版GLM-4.5-Flash将于2026年1月30日正式停止服务,所有未更新的调用请求届时将自动重定向至新模型。此举标志着智谱加速推进其开源模型迭代节奏,以响应开发者对轻量、高效、多功能基座模型的迫切需求。

当前,GLM-4.7-Flash已在Hugging Face(https://huggingface.co/zai-org/GLM-4.7-Flash)与魔搭社区(https://modelscope.cn/models/ZhipuAI/GLM-4.7-Flash)同步开源。随着大模型竞争从“参数军备”转向“效率优先”,轻量化与场景适配能力正成为国产大模型突围的关键路径。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源 大模型
more
把1万份Markdown"吃"进AI大脑,YC掌门人开源的 GBrain 是什么?
杨植麟交卷!Kimi K2.6抢先开源,指挥300个Agent上岗,实测手搓3D格斗游戏
阿里新模型刚屠榜,就被套壳网站“开源”收美元了。。。
国芯科技获批建设“RISC-V开源芯片先进技术研究院”,剑指自主芯生态主战场
NVIDIA Nemotron 3 Super登顶开源榜单,混合架构重塑推理效率边界
字节会师何恺明!开源连续扩散语言模型Cola DLM
从“卷模型”到“拼数据”,昂贵数采下的15个开源项目
WAM杀入导航了 !首个WorldVLN,全面开源
开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测
27B秒了自家397B旗舰,Qwen3.6-27B开源,智能体编程全面超越前代
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号