【区角快讯】2026年1月14日,人工智能领域迎来一项标志性进展:智谱与华为联合宣布开源新一代图像生成模型GLM-Image。该模型依托昇腾Atlas 800T A2硬件平台及昇思MindSpore AI框架,完成了从数据预处理到大规模训练的完整流程,成为首个在国产芯片上全流程训练并达到SOTA(State-of-the-Art,即当前最优水平)性能的多模态开源模型。
GLM-Image采用独创的“自回归+扩散解码器”混合架构,有效融合语言理解与图像生成能力,旨在推动以Nano Banana Pro为代表的新一代“认知型生成”技术范式。这一架构兼顾全局语义指令解析与局部细节刻画,在海报、PPT、科普图等知识密集型视觉内容生成中展现出显著优势。
在技术指标方面,该模型已在CVTG-2K(复杂视觉文本生成)与LongText-Bench(长文本渲染)两大权威评测中位列开源模型榜首,尤其在汉字生成任务上表现突出。同时,其API调用成本低至单图0.1元,且速度优化版本即将上线,进一步提升实用性。
此举被业内视为中国AI产业迈向全栈自主可控的关键一步。过去,顶尖多模态模型训练高度依赖海外高端芯片,而此次智谱与华为的合作验证了国产算力底座完全具备支撑数十亿参数大模型训练的能力,并达到国际先进水平。
更重要的是,GLM-Image的开源将大幅降低AI应用门槛。中小企业、创业者乃至个人开发者均可零成本接入该模型,广泛应用于电商海报设计、教育课件制作、社交媒体图文排版等场景。其支持从手机小图到商业级大图的多分辨率输出,适配多元实际需求。
从产业安全角度看,该成果不仅打破国外技术垄断,更构建起“芯片—框架—算法”三位一体的国产AI技术闭环。这标志着中国AI正从技术跟跑阶段转向部分领域并跑乃至领跑的新阶段。
在具体应用场景中,GLM-Image已展现出强大适应性:可生成逻辑清晰、图文并茂的科普插画;在多格漫画或电商图中保持风格统一与文字准确;高效产出社交媒体封面等复杂排版图像;制作构图精良、文字嵌入精准的节日及商业海报;同时在写实摄影类内容如人像、宠物、风景等方面亦具备高保真生成能力。
这一突破不仅是单一模型的成功,更是国产AI生态体系成熟度的重要体现,为后续自主创新与规模化落地奠定坚实基础。
智谱携手华为开源GLM-Image,国产全栈算力实现多模态SOTA突破
科技区角
2026-01-14 19:01
声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。