【科技纵览】1月20日,智谱AI正式推出并开源其最新轻量化大语言模型GLM-4.7-Flash。该模型采用混合思考架构,总参数规模达300亿,实际推理时仅激活30亿参数,旨在为边缘设备及资源受限环境提供高性能与高效率兼备的部署方案。

即日起,GLM-4.7-Flash将全面接替此前的GLM-4.5-Flash版本,在智谱开放平台BigModel.cn上线,并向开发者免费开放调用权限。据官方披露,在SWE-bench Verified与τ²-Bench等权威基准测试中,该模型综合得分超越gpt-oss-20b及Qwen3-30B-A3B-Thinking-2507,在同参数量级的开源模型中达到当前最优(SOTA)水平。
在内部实测中,GLM-4.7-Flash在前端与后端开发任务中均展现出优异能力。除编码场景外,智谱亦推荐用户将其应用于中文写作、跨语言翻译、长文本生成以及情感表达和角色扮演等通用人工智能任务。
值得注意的是,旧版GLM-4.5-Flash将于2026年1月30日正式停止服务,所有未更新的调用请求届时将自动重定向至新模型。此举标志着智谱加速推进其开源模型迭代节奏,以响应开发者对轻量、高效、多功能基座模型的迫切需求。
当前,GLM-4.7-Flash已在Hugging Face(https://huggingface.co/zai-org/GLM-4.7-Flash)与魔搭社区(https://modelscope.cn/models/ZhipuAI/GLM-4.7-Flash)同步开源。随着大模型竞争从“参数军备”转向“效率优先”,轻量化与场景适配能力正成为国产大模型突围的关键路径。