全球AI功耗正在迅速失控

👆如果您希望可以时常见面，欢迎标星🌟收藏哦~

来源：内容来自半导体芯闻综合。

到 2030 年，人工智能机架的能耗将是传统机架的 20 至 30 倍。

预计到 2030 年，每个 AI 机架的能耗将高达 1MW
预计同期平均机架容量将稳步上升至 30-50kW
冷却和配电成为未来数据中心的战略重点

机架长期以来被认为是数据中心的基本单元，但随着人工智能的兴起，机架正在发生改变，Lennox 数据中心解决方案公司提供的一张新图表（上图）显示了这种变化正在迅速展开。

该公司预测，以前以人工智能为中心的机架仅消耗几千瓦的电力，到 2030 年，其用电量可能达到 1MW，这一规模曾经只有整个设施才能达到。

预计同期数据中心机架的平均功率将达到 30-50kW，反映出计算密度的稳步上升，与 AI 工作负载的对比十分鲜明。

电力输送和冷却的新需求

据预测，单个 AI 机架所消耗的能源是通用机架的 20 到 30 倍，这对电力输送和冷却基础设施提出了新的需求。

Lennox 数据中心解决方案总监 Ted Pulfer 表示，冷却已成为该行业的核心。

他说：“冷却曾经是支持基础设施的一部分，现在已成为讨论的焦点，这得益于计算密度的增加、人工智能工作负载的增加以及人们对液体冷却等方法的兴趣日益浓厚。”

普尔弗描述了目前正在进行的行业合作水平。“制造商、工程师和最终用户的合作比以往任何时候都更加紧密，分享见解，并在实验室和实际部署中共同进行实验。这种实际的合作有助于解决我们面临的一些最复杂的冷却挑战，”他说道。

向机架输送 1MW 电力的目标也正在重塑系统的构建方式。

“行业正在从传统的低压交流电转向高压直流电，例如+/-400V。这减少了功率损耗和电缆尺寸，”Pulfer 解释道。

冷却由设施‘中央’冷却分配单元 (CDU) 负责，该单元负责管理流向机架歧管的液体。液体从那里被输送到直接安装在服务器最热组件上的各个冷却板上。

如今，大多数数据中心都依赖于冷却板，但这种方法存在局限性。微软一直在测试微流体技术，即在芯片背面蚀刻微小的凹槽，使冷却液能够直接流过硅片。

在早期试验中，根据工作负载的不同，这种散热方式的效率比冷板高出三倍，并且可将 GPU 温升降低 65%。

通过将这种设计与绘制芯片热点的人工智能相结合，微软能够更精确地引导冷却剂。

尽管超大规模运营商可能主导这一领域，但 Pulfer 认为小型运营商仍有竞争空间。

“有时，工厂的订单量可能会造成交付瓶颈，这为其他企业介入并创造价值打开了大门。在这个快节奏的市场中，敏捷性和创新性仍然是整个行业的关键优势。”他说道。

显然，功率和散热现在是核心问题，不再是计算性能的次要问题。

正如普尔弗所说：“散热对于保持世界数字基础的平稳、可靠和可持续运行至关重要。”

到本世纪末，机架本身的形状和规模可能会决定数字基础设施的未来。

参考链接

https://www.techradar.com/pro/security/this-graph-alone-shows-how-global-ai-power-consumption-is-getting-out-of-hand-very-quickly-and-its-not-just-about-hyperscalers-or-openai

点这里👆加关注，锁定更多原创内容

*免责声明：文章内容系作者个人观点，半导体芯闻转载仅为了传达一种不同的观点，不代表半导体芯闻对该观点赞同或支持，如果有任何异议，欢迎联系我们。

推荐阅读

喜欢我们的内容就点“在看”分享给小伙伴哦~