【区角快讯】1月16日,智谱公司对外披露,其与华为联合开源的新一代图像生成模型GLM-Image,在上线不到24小时内便跃居全球知名AI开源平台Hugging Face Trending榜单首位。

该公司强调,这是首个完全基于国产芯片完成端到端训练的国产模型,在国际主流开源社区中斩获榜首,标志着我国在多模态大模型领域的全栈自研能力取得实质性进展。
据公开信息,GLM-Image依托华为昇腾Atlas 800T A2硬件设备及昇思MindSpore AI框架,实现了从数据预处理到模型训练的全流程国产化,成为业界首个在国产算力平台上完成训练的SOTA级多模态模型。
在技术架构方面,该模型摒弃了当前主流的潜在扩散模型(LDM)路径,转而采用“自回归+扩散解码器”的混合结构,有效融合了对全局语义指令的理解能力与对图像局部细节的精细刻画。
性能测试显示,GLM-Image在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)两个权威基准中均位列开源模型第一,尤其在中文字符生成任务上表现突出,适用于海报设计、PPT制作及科普插图等知识密集型应用场景。
商业化层面,该模型通过API调用方式提供服务,单张图像生成成本低至0.1元,显著降低了企业与开发者接入前沿图像生成技术的门槛。
在全球AI基础模型竞争日益白热化的背景下,此次国产软硬协同方案的成功落地,为我国构建自主可控的AI生态提供了关键范例。