新闻①：AMD称下一代Instinct MI450是“决定性”的，可在AI领域挑战英伟达领导地位

在今年6月的ADVANCING AI 2025大会上，AMD发布了下一代AI GPU的预告，表示将打造代号为“Helios”的AI机架系统，其中包括了代号“Venice”的新一代EPYC服务器处理器、Instinct MI400系列计算卡、以及代号“VULCANO”的新一代网卡

【硬件资讯】AMD愈战愈勇！下一代AI卡将带来巨大提升，ROCm 7.0继续更新！图1

据Wccftech报道，AMD数据中心解决方案业务部的执行副总裁Forrest Norrod出席了最近的高盛Communacopia+科技大会，对旗下下一代AI产品阵容表现出非常乐观的情绪，称可以让客户重新思考是否要选择英伟达的产品。

Forrest Norrod表示，称下一代Instinct MI450将是AMD的“米兰时刻（Milan moment）”。这里需要说明一下，Forrest Norrod特指的是AMD代号“Milan”的EPYC服务器处理器，性能上实现了巨大的飞跃，并将竞争对手英特尔抛在了身后。在Forrest Norrod看来，Instinct MI450相比Rubin架构GPU将有更强的竞争优势，可在人工智能（AI）领域挑战英伟达领导地位。

【硬件资讯】AMD愈战愈勇！下一代AI卡将带来巨大提升，ROCm 7.0继续更新！图2

按照AMD公布的规格，Instinct MI400系列GPU将提供40PF/20PF级别的FP4/FP8运算性能，配备432GB的HBM4，显存带宽可达19.6TB/s，每GPU的横向阵列带宽可达300GB/s，号称实现10倍于Instinct MI355X的AI推理运算能力。另外“Helios”与竞品Vera Rubin相比，将在HBM4显存总容量、内存带宽、横向阵列带宽等规格上达到方法的1.5倍。

原文链接：https://www.expreview.com/101707.html

每次都是“决定性”产品，但每次AMD都没能完全战胜NVIDIA，这其实是有点可惜的，包括这一代的MI350X在内，AMD从未挑战成功过。

而按照AMD的说法，似乎下一代将会有更大的变化，称下一代Instinct MI450将是AMD的“米兰时刻”，似乎是在表示下一代的Instinct MI450将会与Milan EPYC处理器一样，奠定AMD的性能强势地位。不过，能够挑战NVIDIA的领导地位还是有些困难的，毕竟NVIDIA在该领域强大的不仅仅是性能，而是强大的CUDA生态啊。

新闻②：AMD发布ROCm 7.0更新支持CDNA 4架构的Instinct MI350

AMD宣布，对ROCm软件栈进行了更新，推出了新的迭代版本ROCm 7.0，这也是迄今为止最大规模的更新之一。这一新版本里，AMD引入了增强的框架和新算法，旨在打造可替代英伟达CUDA的计算生态系统。

【硬件资讯】AMD愈战愈勇！下一代AI卡将带来巨大提升，ROCm 7.0继续更新！图3

AMD表示，人工智能创新正以前所未有的速度加速，模型扩展到数千亿个参数，推理需求不断增长，企业需要平衡成本和性能的可扩展高效解决方案。开发人员面临着越来越大的压力，既要跟上这些要求，又要确保灵活性、可移植性和未来准备。ROCm 7.0的发布，使得开发人员和企业能够更快地行动、更智能地扩展并部署AI。

ROCm 7.0主要特性：

支持Instinct MI350系列GPU，突破性AI训练和AI推理性能。
跨集群的无缝分布式推理，支持领先的框架。
HIP 7.0增强了代码可移植性，简化了跨硬件生态系统的开发和迁移。
以企业为中心的新工具，可简化AI基础设施管理和部署。
采用AMD Quark量化技术，实现了流行的MXFP4和FP8格式大型模型。

在今年6月的AMD Advancing AI 2025上，AMD发布了基于CDNA 4架构的Instinct MI350系列计算卡。其基于迭代升级后的芯片堆叠封装工艺打造，采用N3P工艺的加速器复合核心（XCD）通过COWOS-S封装技术堆叠在采用N6工艺的I/O核心（IOD）之上，3D混合架构为带来了高性能密度和高能效比，IOD-IOD互连以及HBM3E显存的集成则给予2.5D架构打造。

【硬件资讯】AMD愈战愈勇！下一代AI卡将带来巨大提升，ROCm 7.0继续更新！图4

AMD Instinct MI350系列GPU包含有8个XCD模块，每个XCD模块32组计算单元，共计256组，1024个矩阵核心，每个XCD配置2MB L2缓存；IOD基于2个N6工艺核心构成，提供有128通道HBM3E显存接口与256MB容量的AMD Infinity缓存；2个HBM3E显存采用8堆栈结构，每个堆栈为12层堆叠的36GB，数据频率为8Gbps，可提供8TB/s的显存带宽；内部所用的Infinity Fabric AP互联带宽达到5.5TB/s，外部连接则基于1075GB/s带宽的第四代Infinity Fabric总线与128GB/s带宽的PCIe 5.0接口。

原文链接：https://www.expreview.com/101761.html

AMD当然也有自己的AI生态战场，也就是自家的ROCm软件栈。而就在近期，AMD也更新了自家的ROCm 7.0，是迄今为止最大规模的更新，显然是剑指NVIDIA来的。

根据官方播片中的测试结果，新的ROCm 7.0在推理 Deepseek R1 AI 性能是 ROCm 6 的 3.8 倍，Llama 3.1 70B 模型上性能提升 3.2 倍，这仅仅是通过软件的更新就实现的！

最重要的是，新版本引入对 Instinct MI355X、MI350X 的支持，支持了更强性能的硬件，希望能有更强的表现吧！

新闻③：马斯克力挺 AMD：在中小型 AI 模型方面相当不错，暗示将降低对英伟达依赖

9 月 13 日消息，科技媒体 Wccftech 昨日（9 月 12 日）发布博文，报道称埃隆・马斯克（Elon Musk）在社交平台上表示，AMD 的 AI 硬件在运行中小型 AI 模型时表现“相当不错”。这一表态被视为对 AMD 技术实力的认可，同时也暗示其在 AI 市场的竞争潜力。

【硬件资讯】AMD愈战愈勇！下一代AI卡将带来巨大提升，ROCm 7.0继续更新！图5

马斯克旗下人工智能公司 xAI 已采用 AMD 的 Instinct MI300 及 MI300X AI 加速器来运行部分模型。作为长期合作伙伴，特斯拉此前也与 AMD 在硬件领域展开合作。不过，在涉及超大规模模型训练的任务中，英伟达依旧是马斯克的首选供应商。

IT之家援引博文介绍，AMD 的 Instinct 系列在推理、模型微调及中等规模基础模型应用方面表现突出，已获得部分行业采用。然而，由于英伟达依托 CUDA 生态长期构筑的技术壁垒，AMD 在微软、Meta、谷歌等大型科技公司中的市场份额仍然有限。

英伟达率先抓住 AI 浪潮，构建了“锁定”式生态系统，让竞争对手难以切入。AMD 虽然在 AI 硬件性能上取得显著提升，但在大型企业客户拓展方面仍需更多努力。马斯克的公开认可，被视为对 AMD 品牌形象和市场信心的积极推动。

该媒体认为 AMD 近年来不断完善 ROCm 软件栈，并持续推出新一代 AI 加速产品，正向英伟达发起更直接的挑战。随着技术和生态的双向进步，未来 AI 芯片市场的竞争有望进一步加剧，中小型 AI 模型或成为 AMD 的重要突破口。

原文链接：https://m.ithome.com/html/882691.htm

值得一提的是，就连马斯克也站出来为AMD背书了，表示其在中小型 AI 模型方面相当不错。显然，马斯克也对现在这个被NVIDIA垄断的AI市场表现出厌倦了。AMD做了这么多的准备，不管是软件硬件都是最强的时刻，是不是真的能挑战一下NVIDIA呢？

欢迎加入

买电脑讨论群：386615430

电脑吧评测室官方一群：798545305

关注B站@电脑吧评测室

备注：

文章转载自网络（链接如上）。文章出现的任何图片，标志均属于其合法持有人；本文仅作传递信息之用。如有侵权可在本文内留言。

引用文章内容与观点不代表电脑吧评测室观点。

【硬件资讯】AMD愈战愈勇！下一代AI卡将带来巨大提升，ROCm 7.0继续更新！图6