新 闻①: AMD称下一代Instinct MI450是“决定性”的,可在AI领域挑战英伟达领导地位
在今年6月的ADVANCING AI 2025大会上,AMD发布了下一代AI GPU的预告,表示将打造代号为“Helios”的AI机架系统,其中包括了代号“Venice”的新一代EPYC服务器处理器、Instinct MI400系列计算卡、以及代号“VULCANO”的新一代网卡

据Wccftech报道,AMD数据中心解决方案业务部的执行副总裁Forrest Norrod出席了最近的高盛Communacopia+科技大会,对旗下下一代AI产品阵容表现出非常乐观的情绪,称可以让客户重新思考是否要选择英伟达的产品。
Forrest Norrod表示,称下一代Instinct MI450将是AMD的“米兰时刻(Milan moment)”。这里需要说明一下,Forrest Norrod特指的是AMD代号“Milan”的EPYC服务器处理器,性能上实现了巨大的飞跃,并将竞争对手英特尔抛在了身后。在Forrest Norrod看来,Instinct MI450相比Rubin架构GPU将有更强的竞争优势,可在人工智能(AI)领域挑战英伟达领导地位。

按照AMD公布的规格,Instinct MI400系列GPU将提供40PF/20PF级别的FP4/FP8运算性能,配备432GB的HBM4,显存带宽可达19.6TB/s,每GPU的横向阵列带宽可达300GB/s,号称实现10倍于Instinct MI355X的AI推理运算能力。另外“Helios”与竞品Vera Rubin相比,将在HBM4显存总容量、内存带宽、横向阵列带宽等规格上达到方法的1.5倍。
原文链接:https://www.expreview.com/101707.html
而按照AMD的说法,似乎下一代将会有更大的变化,称下一代Instinct MI450将是AMD的“米兰时刻”,似乎是在表示下一代的Instinct MI450将会与Milan EPYC处理器一样,奠定AMD的性能强势地位。不过,能够挑战NVIDIA的领导地位还是有些困难的,毕竟NVIDIA在该领域强大的不仅仅是性能,而是强大的CUDA生态啊。
新 闻 ②: AMD发布ROCm 7.0更新支持CDNA 4架构的Instinct MI350
AMD宣布,对ROCm软件栈进行了更新,推出了新的迭代版本ROCm 7.0,这也是迄今为止最大规模的更新之一。这一新版本里,AMD引入了增强的框架和新算法,旨在打造可替代英伟达CUDA的计算生态系统。

AMD表示,人工智能创新正以前所未有的速度加速,模型扩展到数千亿个参数,推理需求不断增长,企业需要平衡成本和性能的可扩展高效解决方案。开发人员面临着越来越大的压力,既要跟上这些要求,又要确保灵活性、可移植性和未来准备。ROCm 7.0的发布,使得开发人员和企业能够更快地行动、更智能地扩展并部署AI。
ROCm 7.0主要特性:
支持Instinct MI350系列GPU,突破性AI训练和AI推理性能。
跨集群的无缝分布式推理,支持领先的框架。
HIP 7.0增强了代码可移植性,简化了跨硬件生态系统的开发和迁移。
以企业为中心的新工具,可简化AI基础设施管理和部署。
采用AMD Quark量化技术,实现了流行的MXFP4和FP8格式大型模型。
在今年6月的AMD Advancing AI 2025上,AMD发布了基于CDNA 4架构的Instinct MI350系列计算卡。其基于迭代升级后的芯片堆叠封装工艺打造,采用N3P工艺的加速器复合核心(XCD)通过COWOS-S封装技术堆叠在采用N6工艺的I/O核心(IOD)之上,3D混合架构为带来了高性能密度和高能效比,IOD-IOD互连以及HBM3E显存的集成则给予2.5D架构打造。

AMD Instinct MI350系列GPU包含有8个XCD模块,每个XCD模块32组计算单元,共计256组,1024个矩阵核心,每个XCD配置2MB L2缓存;IOD基于2个N6工艺核心构成,提供有128通道HBM3E显存接口与256MB容量的AMD Infinity缓存;2个HBM3E显存采用8堆栈结构,每个堆栈为12层堆叠的36GB,数据频率为8Gbps,可提供8TB/s的显存带宽;内部所用的Infinity Fabric AP互联带宽达到5.5TB/s,外部连接则基于1075GB/s带宽的第四代Infinity Fabric总线与128GB/s带宽的PCIe 5.0接口。
原文链接:https://www.expreview.com/101761.html
AMD当然也有自己的AI生态战场,也就是自家的ROCm软件栈。而就在近期,AMD也更新了自家的ROCm 7.0,是迄今为止最大规模的更新,显然是剑指NVIDIA来的。
根据官方播片中的测试结果,新的ROCm 7.0在推理 Deepseek R1 AI 性能是 ROCm 6 的 3.8 倍,Llama 3.1 70B 模型上性能提升 3.2 倍,这仅仅是通过软件的更新就实现的!
最重要的是,新版本引入对 Instinct MI355X、MI350X 的支持,支持了更强性能的硬件,希望能有更强的表现吧!
新 闻③: 马斯克力挺 AMD:在中小型 AI 模型方面相当不错,暗示将降低对英伟达依赖
9 月 13 日消息,科技媒体 Wccftech 昨日(9 月 12 日)发布博文,报道称埃隆・马斯克(Elon Musk)在社交平台上表示,AMD 的 AI 硬件在运行中小型 AI 模型时表现“相当不错”。这一表态被视为对 AMD 技术实力的认可,同时也暗示其在 AI 市场的竞争潜力。

马斯克旗下人工智能公司 xAI 已采用 AMD 的 Instinct MI300 及 MI300X AI 加速器来运行部分模型。作为长期合作伙伴,特斯拉此前也与 AMD 在硬件领域展开合作。不过,在涉及超大规模模型训练的任务中,英伟达依旧是马斯克的首选供应商。
IT之家援引博文介绍,AMD 的 Instinct 系列在推理、模型微调及中等规模基础模型应用方面表现突出,已获得部分行业采用。然而,由于英伟达依托 CUDA 生态长期构筑的技术壁垒,AMD 在微软、Meta、谷歌等大型科技公司中的市场份额仍然有限。
英伟达率先抓住 AI 浪潮,构建了“锁定”式生态系统,让竞争对手难以切入。AMD 虽然在 AI 硬件性能上取得显著提升,但在大型企业客户拓展方面仍需更多努力。马斯克的公开认可,被视为对 AMD 品牌形象和市场信心的积极推动。
该媒体认为 AMD 近年来不断完善 ROCm 软件栈,并持续推出新一代 AI 加速产品,正向英伟达发起更直接的挑战。随着技术和生态的双向进步,未来 AI 芯片市场的竞争有望进一步加剧,中小型 AI 模型或成为 AMD 的重要突破口。
买电脑讨论群:386615430
电脑吧评测室官方一群:798545305
关注B站@电脑吧评测室