电子发烧友网报道(文 / 吴子鹏)第十三届半导体设备与核心部件及材料展(CSEAC 2025)的主题是 “做强中国芯,拥抱芯世界”。在展会开幕式暨 2025 集成电路(无锡)创新发展论坛上,摩尔线程创始人兼首席执行官张建中(James Zhang)分享了该公司为提升 AI 工厂效率所做的努力与成果。他在演讲中指出,先进 AI 工厂与先进晶圆厂的逻辑存在趋同性。其中,晶圆厂覆盖从 28nm 到 3nm 的多种制程,针对不同制程研发了氧化 / 薄膜沉积、化学机械平坦化等专属技术,可生产先进芯片,为 AI 工厂提供硬件基础;而 AI 工厂作为生产先进模型的 “超级工厂”,针对千亿、万亿、十万亿等不同参数规模的模型,配备了 GPU 芯片、基础软件、网络拓扑等不同层级的技术支持,从底层硬件到上层系统全方位保障模型生产流程。一座 AI 工厂的效率,主要由 “加速计算通用性 — 单芯片有效算力 — 单节点效率 — 集群效率 — 集群稳定性” 这一链路决定。针对该链路,摩尔线程提出五大核心技术布局,全方位提升 AI 工厂生产效率,为国产智能生产注入强大动力,也为人工智能与芯片产业的协同发展树立了典范。在技术架构层面,摩尔线程高效 AI 工厂由全功能 GPU、MUSA 架构、MUSA 软件栈、KUAE 集群及零中断方案等关键部分构成。具体来看:首先,摩尔线程为 AI 工厂提供全功能 GPU,涵盖图形 GPU、GPGPU 与 AI 芯片,可用于构建 AI 计算加速引擎、物理仿真与科学计算引擎、现代图形渲染引擎及智能多媒体引擎。这种 “多元算力 + 多样计算” 的组合,能更好地适配丰富应用场景,包括视频分析、语音识别、自动驾驶、元宇宙、数字办公、大模型开发、视频直播、云端渲染、科学研究等。同时,这些全功能 GPU 可覆盖 AI 应用所需的各类计算精度,满足 AI 工厂多样化计算场景需求:例如,FP8 广泛应用于混合精度训练、大语言模型推理;FP64 适用于天气预报、气候仿真等高性能科学计算场景;FP32/TF32 可支撑游戏、云电脑、高精度推理、高精度训练、仿真及科学计算;BF16/FP16 常用于机器学习、大语言模型训练;INT8 则在量化推理、计算机视觉(CV)推理中发挥作用。其次,摩尔线程 MUSA(Meta-computing Unified System Architecture,元计算统一系统架构)通过计算、通信、存储三大技术创新,提升单芯片有效算力。作为全功能、多引擎、可配置的 GPU 架构,MUSA 提供统一的 MUSA 编程接口,核心是构建 “统一的编程模型、软件运行库、驱动程序框架、指令集架构与芯片架构”,支持从云端到边缘的多类计算场景。其最终目标是打造开放、兼容且高性能的国产 GPU 生态系统,覆盖人工智能、图形渲染、多媒体处理、科学计算等领域。借助 MUSA 架构,AI 工厂可实现硬件资源池化,让计算、内存、通信等资源实现全局共享,同时支持多前端引擎异步运行与高速跨引擎同步。摩尔线程 MUSA 软件栈构建了从底层 GPU 驱动到上层 AI、科学计算、多媒体等各类应用工具的完整生态,为不同场景的开发与应用提供全面支持。通过驱动优化、算子库生态建设、通信技术升级、工具链完善等核心模块,MUSA 软件栈助力开发者充分释放国产 GPU 的性能潜能,推动 AI 基础设施的国产化落地进程。张建中指出,依托 MUSA 统一系统架构及软件栈,摩尔线程致力于提供 “端云一体、触手可及” 的算力,重塑 AI 产业格局。在云侧,通过超大规模集群算力支撑通用大模型的训练与推理,提供丰富云资源,服务于云端大模型训练、云端大模型微调推理、云端原生大模型 AI 应用、云桌面、元宇宙、云游戏等创新场景;在端侧,打造本地算力底座,支持端侧部署个性化 AI 智能体及大模型工具 —— 以 AI BOOK 算力本为例,其搭载多元异构算力处理器,具备旗舰性能与顶级配置,可运行原生 AI 系统并预装 AI 编程环境,助力实现 “千人千面” 的 AI 智能体。摩尔线程 KUAE 集群是为 AI 大模型训练与推理提供核心支撑的智算集群。该集群具备三大核心优势:一是支持 5D 并行训练,整合数据并行、张量并行、序列并行、专家并行、流水线并行五大并行技术,全面兼容 Transformer 等主流架构,显著提升大规模集群训练效率;二是覆盖大模型全生命周期,支持预训练、微调和推理全流程,可适配所有主流开源大模型(包括 LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等)的训练与微调;三是应用场景广泛,可支撑 AIGC、数字孪生、物理仿真、元宇宙等多模态应用落地。摩尔线程创新推出零中断容错方案,最大化提升训练可靠性与效率。该方案突破传统容错回退机制的局限,彻底消除中断时间与算力浪费,有效训练时间占比(ETTR)超过 99%。具体来看,其通过多维度训练洞察提升集群可靠性,使慢节点、系统挂起(Hang)等异常的处理效率提升 50%;同时借助集群自检与调度优化增强集群稳定性,让训练成功率及速度提升 10%。综上所述,摩尔线程的五大核心技术布局,精准切入 AI 工厂从单芯片算力到集群稳定性的全链条效率痛点,最终形成 “硬件筑基、软件赋能、集群提效、容错护航” 的一体化解决方案。声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。更多热点文章阅读11家半导体设备企业H1:刻蚀设备狂卖50亿,最高净利润暴涨73%阿里放大招:自研AI芯片100%国产,不用台积电代工小米入局,又一存储风口!Labubu 带火!消费级 3D 打印产业链起飞工信部:2030年卫星通信用户超千万!产业链起飞?点击关注 星标我们将我们设为星标,不错过每一次更新!喜欢就奖励一个“在看”吧!