AI的未来，不再取决于芯片

公众号记得加星标⭐️，第一时间看推送不会错过。

根据迪伦·帕特尔(Dylan Patel)在SEMI产业战略研讨会（ISS）上发表的题为“从token到基础设施”的演讲，其中一个最重要的主题是人工智能经济堆栈的兴起。在这个堆栈中，从半导体制造到云基础设施、模型提供商和应用程序，人工智能的每一层都通过计算经济紧密耦合在一起。该演讲指出，人工智能不再仅仅是一个软件业务；它已成为一个由电力、硅、内存、网络和数据中心投资驱动的工业级基础设施业务。

人工智能行业日益以资本支出转化为token（人工智能产出的基本单位）为核心特征。SemiAnalysis 将这一过程描述为“token工厂”，其中 GPU、网络设备、内存系统、电力基础设施和软件栈协同工作，生成用于人工智能推理和训练的token。经济效益始于昂贵的加速器系统，例如 NVIDIA H200 级服务器，其资本成本、折旧、电力和托管费用决定了每个生成token的成本。随着模型规模的扩大和用户需求的增长，基础设施效率成为一项主要的竞争优势。

该报告强调，推理成本正迅速成为人工智能公司的主要支出。与传统软件企业服务额外用户几乎无需成本不同，人工智能公司每生成一个token都需要支付直接的计算成本。这形成了一种独特的经济模式，即收入增长与计算消耗密切相关。例如，OpenAI 的推理成本预计将与收入增长几乎呈线性增长，因此硬件优化和数据中心效率对于盈利能力至关重要。

报告中指出的一个主要瓶颈是高带宽内存（HBM）。SemiAnalysis预测，在需求持续超过供应的情况下，HBM短缺可能会持续到2027年。与此同时，内存制造商向HBM生产转型可能会加剧传统DRAM市场的短缺。这种“双重短缺困境”反映了人工智能需求正在如何重塑整个半导体生态系统。HBM至关重要，因为现代人工智能加速器需要巨大的内存带宽才能高效地运行日益庞大的模型。如果没有足够的HBM供应，即使是先进的GPU也无法发挥其全部性能潜力。

此次演示还展示了领先的人工智能实验室如何获取前所未有的计算能力。OpenAI 的计算能力合同预计将在未来几年内大幅增长，以数据中心电力（以千兆瓦计）衡量。同样，主要云服务提供商和人工智能实验室也在签署数十亿美元的 GPU 容量协议。SemiAnalysis 指出，人工智能云合同通常能为服务提供商带来多年期的每瓦 10 至 13 美元的年收入，从而为基础设施投资者创造可观的回报。

这些协议表明，获取计算资源的重要性正变得与获取人才或知识产权同等重要。微软、OpenAI、Anthropic、Meta 和 xAI 等公司实际上正在提前数年争夺未来的计算资源。其结果是，一种新的经济模式正在形成，在这个模式下，超大规模数据中心、人工智能实验室和半导体供应商之间的联系日益紧密。

这一变革的意义远不止于半导体行业。人工智能正在创造一个涵盖芯片设计、晶圆代工、先进封装、存储器制造、网络设备、发电和数据中心建设等各个环节的需求周期。模型能力的每一次提升都会带动对计算基础设施的额外需求，进而推动整个供应链的投资。

对投资者而言，这意味着价值创造不再仅仅集中在人工智能软件公司。半导体制造商、存储器供应商、网络设备供应商和数据中心运营商也可能从人工智能驱动的增长中分得一杯羹。对政府而言，该报告强调了能源供应和半导体制造能力的战略重要性。对企业而言，了解token经济对于评估人工智能部署成本和长期投资回报至关重要。

总而言之，帕特尔的论点是，人工智能应该被视为一个垂直整合的产业生态系统。成功不仅取决于更优秀的算法，还取决于能否大规模地保障内存、电力、计算能力和基础设施。那些能够掌握从芯片到token的全栈技术的公司，将定义未来十年的技术领导地位。

（来源：编译自semiwiki）

*免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

END

今天是《半导体行业观察》为您分享的第4453内容，欢迎关注。

推荐阅读

★