谷歌的最新报告称,其 Gemini 模型处理一次指令的能耗,还不到观看九秒电视的水平。
作者:SORAB GHASWALLA
日期:2025 年 8 月 23 日
为了提升人工智能这一新兴领域的透明度,谷歌最近发布了一份技术报告,详述了其 Gemini 系列模型在能耗、碳排放和水资源使用方面的数据。
这份报告全面揭示了 Gemini 应用在处理一次文本查询中位数时所产生的环境足迹。
市场分析师指出,这是大型科技公司首次敢于就使用大语言模型的环境与资源成本,发布如此详尽的报告。
报告估算,一次中位数的 Gemini 文本查询会消耗 0.24 瓦时的能量,排放 0.03 克二氧化碳当量,并使用 0.26 毫升的水。
这是什么概念呢?谷歌将其比作观看不到九秒的电视所消耗的能量。
也就是说,你向这个 AI 工具提出的一个简单问题,其背后服务器消耗的电力,就和你坐在家里看 9 秒钟电视差不多。
核心概念:什么是文本查询中位数?
在深入探讨前,我们必须先理解文本查询中位数的真正含义。
你发出的每一次指令,其复杂程度千差万别,消耗的能量也因此天差地别。
比如一个极简问题:“2+2 等于几?”,它消耗的能量微乎其微。
但一个复杂任务:“请就量子计算在新兴市场的社会经济影响,撰写一篇 5000 字的学术论文并引用来源”,则会消耗巨量能源。
谷歌在测量数十亿次查询后,会得到一个从极低到极高的庞大数值范围。
想把所有数据都放进报告里是不现实的,这时中位数就派上了用场。
简单说,中位数就是将所有数值从低到高排列后,处在最中间的那个值。它代表了最普遍的情况。
为什么用中位数而非平均数?
使用中位数,能更真实、更具代表性地反映情况。
因为平均数很容易被误导。少数几个能耗极高的复杂查询,会像异常值一样,将整体平均水平急剧拉高。
这就会让普通查询的实际能耗,看起来比真实情况高出许多。
相比之下,中位数能更好地反映一次典型、日常查询的真实能耗,它剔除了两端的极端情况,展现了最常见的用户体验。
谷歌的全栈式测量方法
报告的一大亮点,是谷歌计算这些数据的独特方法论。
注意:前方为技术细节,不感兴趣的读者可直接跳过。
谷歌强调,他们采用的是一种全栈方法,把处理 AI 查询所涉及的全部基础设施都计算在内。
这不仅包括 AI 加速器(如谷歌自家的张量处理单元 TPU)直接消耗的电力。
它还涵盖了主机服务器的 CPU 和内存、为应对流量洪峰而待机的空闲系统,以及数据中心的冷却和配电等所有间接开销。
谷歌指出,许多公开的估算方法不够全面,往往只计算 AI 硬件本身消耗的电力,得出的数据往好了说是过于乐观,实际上是严重低估。
谷歌坦言,如果只用那种狭隘的方法计算,Gemini 的单次查询能耗将仅为 0.10 瓦时。
的确,这堆技术术语对普通读者来说太难懂了。我们不妨用一个计算披萨成本的比喻来理解。
别人的乐观算法:
好比说一张披萨的成本就只是面粉、番茄和奶酪这些原材料的钱。这个数字很低,但不真实,因为它忽略了所有其他成本。
谷歌的全栈算法:
这相当于计算这张披萨送到你面前的全部成本。它包括:
原材料:执行思考的 AI 芯片。 厨师薪水:支持 AI 芯片的主机。 预热的烤箱:为应对高峰期而待命的备用服务器。 餐厅租金和水电:整个数据中心的运营开销,特别是巨量的空调散热。
谷歌想表达的是,他们报出的 0.24 瓦时这个数字之所以更高,是因为他们更加诚实,计算了所有隐藏的能源成本。
而那些声称能耗更低的,很可能只算了“原材料”,却忽略了“厨师、烤箱和房租”,从而给出了一个误导性的低估值。
效率的巨大飞跃
报告还展示了 Gemini 在过去一年里取得的惊人效率提升。
谷歌宣称,在提供更高质量回复的同时,Gemini 的单次查询能耗降低了 33 倍,碳足迹更是减少了 44 倍。
这主要得益于软硬件协同优化,以及更高效的模型架构等多方面的努力。
平心而论,谷歌在降低 AI 环境足迹和推动负责任的 AI 发展方面,确实付出了巨大努力。
分析师认为,此举无疑会给其他 AI 巨头带来压力,促使它们公开类似数据,从而就这项技术的环境可持续性,展开一场更有依据的公共讨论。
然而,这正是问题的关键所在……
谷歌说的 9 秒,只是单次查询的微观视角
在分析开始前,我必须说明,本文只聚焦于电力消耗。
将单次查询的能耗比作看 9 秒电视,听起来似乎微不足道。
但你看待这个问题的角度不同,得出的结论也天差地别。这个比喻巧妙地掩盖了一个事实:当微小的单次消耗乘以全球用户和天文数字般的日查询量后,总能源需求将变得无比巨大。
可一旦你算一笔总账,就会发现 Gemini 一天消耗的总电量,足以驱动一个印度小镇或村庄里 2,500 到 80,000 户家庭。
之所以范围跨度如此之大,是因为谷歌从未公布过全球日查询量的官方数据。有专家估算约为 10 亿次/天,也有保守估算为 2800 万次/天。
到 2025 年中,分析报告显示 Gemini 的日活跃用户在 3500 万到 4500 万之间。所以,2800 万是一个相对保守且现实的数字,但这仅仅是直接登录使用 Gemini 的用户。
如果算上 Gemini 在谷歌搜索、Gmail 等产品中的集成应用,专家相信每日总查询量会急剧攀升。
截至 2025 年,谷歌搜索每天要处理高达 130 到 140 亿次请求。
假设其中仅有 7-8% 的搜索触发了由 Gemini 驱动的 AI 概览功能,日查询量就已经轻松突破 10 亿次。
场景一:10 亿次查询,如何让 9 秒变成 8 万户家庭的日用电?
让我们基于全球每天 10 亿次查询来计算。
每日总能耗:
10 亿次/天 × 0.24 瓦时/次 = 2.4 亿瓦时/天。
换算一下:
这相当于每天 24 万千瓦时 (kWh)。
这意味着什么?
一个普通印度家庭日均用电约 3 千瓦时。因此,Gemini 一天的能耗足以支撑 8 万个印度家庭的日常用电。
这已经是一个小城镇的每日总耗电量。
如果用谷歌自己的比喻,Gemini 一天的总耗电量,相当于一个人不眠不休地看 285 年电视。
(285 年的计算过程:10 亿次查询 × 9 秒/次 = 90 亿秒,换算后约等于 285 年。)
保守场景:即便查询量降低,能耗依然惊人
现在,我们用非常保守的 2800 万次日查询量来计算。
每日总能耗:
2800 万次 × 0.24 瓦时/次 = 672 万瓦时。
换算一下:
这相当于 6720 千瓦时 (kWh)。
这意味着什么?
即便在如此保守的估算下,Gemini 一天也会吞噬掉足够 2240 个印度家庭运行的电力。
而这相当于连续观看 8 年的电视。
(8 年的计算过程:2800 万次查询 × 9 秒/次 = 2.52 亿秒,换算后约等于 8 年。)
现在,9 秒电视这个说法,听起来还那么轻松吗?
无论是乐观估计下的 8 万户家庭,还是保守估计下的 2240 户家庭,这些计算都揭示了一个残酷的现实:
那个让单次行为显得微不足道的比喻,一旦置于全球化的宏大尺度下,其真实影响便显得触目惊心。
同样,专家估算,你每向 Gemini 提一个问题,谷歌就要为此付出 0.5 到 3 美分的成本。
这听起来无足挂齿,但乘以数十亿的日查询量,就会累积成一笔让公司头疼不已的巨额账单。
那么,谷歌为何要强调单次查询这个视角?
从谷歌的角度看,这份报告的重点是展示其在提升效率方面的工程成就。它想证明自己已经成功解决了降低单次查询成本这一技术难题。
9 秒电视这个比喻非常奏效,因为它:
贴近生活:
让普通用户能直观感受到自己单次操作的微小成本。凸显进步:
有力地证明了新模型和硬件相比过去有多么出色。
然而,这种叙事框架回避了一个更宏大、更复杂的问题:这项技术在地球尺度上的总体环境足迹。
对于谷歌和整个科技行业而言,真正的挑战,早已不是优化单次查询的成本。
真正的挑战是,如何用可再生能源去支撑由技术优化本身带来的指数级增长,并为其遍布全球的超大型数据中心提供源源不断的绿色电力。
参考资料:https://cloud.google.com/blog/products/infrastructure/measuring-the-environmental-impact-of-ai-inference
https://services.google.com/fh/files/misc/measuring_the_environmental_impact_of_delivering_ai_at_google_scale.pdf
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!