谷歌首次披露 Gemini 能耗:单次推理仅需 9 秒电视电量,一天却能养活 8 万户印度家庭

智能情报所 2025-08-25 17:03

谷歌的最新报告称,其 Gemini 模型处理一次指令的能耗,还不到观看九秒电视的水平。

作者:SORAB GHASWALLA

日期:2025 年 8 月 23 日

为了提升人工智能这一新兴领域的透明度,谷歌最近发布了一份技术报告,详述了其 Gemini 系列模型在能耗、碳排放和水资源使用方面的数据。

这份报告全面揭示了 Gemini 应用在处理一次文本查询中位数时所产生的环境足迹。

市场分析师指出,这是大型科技公司首次敢于就使用大语言模型的环境与资源成本,发布如此详尽的报告。

报告估算,一次中位数的 Gemini 文本查询会消耗 0.24 瓦时的能量,排放 0.03 克二氧化碳当量,并使用 0.26 毫升的水。

资讯配图

这是什么概念呢?谷歌将其比作观看不到九秒的电视所消耗的能量。

也就是说,你向这个 AI 工具提出的一个简单问题,其背后服务器消耗的电力,就和你坐在家里看 9 秒钟电视差不多。

核心概念:什么是文本查询中位数?

在深入探讨前,我们必须先理解文本查询中位数的真正含义。

你发出的每一次指令,其复杂程度千差万别,消耗的能量也因此天差地别。

比如一个极简问题:“2+2 等于几?”,它消耗的能量微乎其微。

但一个复杂任务:“请就量子计算在新兴市场的社会经济影响,撰写一篇 5000 字的学术论文并引用来源”,则会消耗巨量能源。

谷歌在测量数十亿次查询后,会得到一个从极低到极高的庞大数值范围。

想把所有数据都放进报告里是不现实的,这时中位数就派上了用场。

简单说,中位数就是将所有数值从低到高排列后,处在最中间的那个值。它代表了最普遍的情况。

为什么用中位数而非平均数?

使用中位数,能更真实、更具代表性地反映情况。

因为平均数很容易被误导。少数几个能耗极高的复杂查询,会像异常值一样,将整体平均水平急剧拉高。

这就会让普通查询的实际能耗,看起来比真实情况高出许多。

相比之下,中位数能更好地反映一次典型、日常查询的真实能耗,它剔除了两端的极端情况,展现了最常见的用户体验。

谷歌的全栈式测量方法

报告的一大亮点,是谷歌计算这些数据的独特方法论。

注意:前方为技术细节,不感兴趣的读者可直接跳过。

谷歌强调,他们采用的是一种全栈方法,把处理 AI 查询所涉及的全部基础设施都计算在内。

这不仅包括 AI 加速器(如谷歌自家的张量处理单元 TPU)直接消耗的电力。

它还涵盖了主机服务器的 CPU 和内存、为应对流量洪峰而待机的空闲系统,以及数据中心的冷却和配电等所有间接开销。

谷歌指出,许多公开的估算方法不够全面,往往只计算 AI 硬件本身消耗的电力,得出的数据往好了说是过于乐观,实际上是严重低估。

谷歌坦言,如果只用那种狭隘的方法计算,Gemini 的单次查询能耗将仅为 0.10 瓦时。

的确,这堆技术术语对普通读者来说太难懂了。我们不妨用一个计算披萨成本的比喻来理解。

  • 别人的乐观算法:

    好比说一张披萨的成本就只是面粉、番茄和奶酪这些原材料的钱。这个数字很低,但不真实,因为它忽略了所有其他成本。

  • 谷歌的全栈算法:

    这相当于计算这张披萨送到你面前的全部成本。它包括:

    • 原材料:执行思考的 AI 芯片。
    • 厨师薪水:支持 AI 芯片的主机。
    • 预热的烤箱:为应对高峰期而待命的备用服务器。
    • 餐厅租金和水电:整个数据中心的运营开销,特别是巨量的空调散热。

谷歌想表达的是,他们报出的 0.24 瓦时这个数字之所以更高,是因为他们更加诚实,计算了所有隐藏的能源成本。

而那些声称能耗更低的,很可能只算了“原材料”,却忽略了“厨师、烤箱和房租”,从而给出了一个误导性的低估值。

效率的巨大飞跃

报告还展示了 Gemini 在过去一年里取得的惊人效率提升。

谷歌宣称,在提供更高质量回复的同时,Gemini 的单次查询能耗降低了 33 倍,碳足迹更是减少了 44 倍。

资讯配图

这主要得益于软硬件协同优化,以及更高效的模型架构等多方面的努力。

平心而论,谷歌在降低 AI 环境足迹和推动负责任的 AI 发展方面,确实付出了巨大努力。

分析师认为,此举无疑会给其他 AI 巨头带来压力,促使它们公开类似数据,从而就这项技术的环境可持续性,展开一场更有依据的公共讨论。

然而,这正是问题的关键所在……

谷歌说的 9 秒,只是单次查询的微观视角

在分析开始前,我必须说明,本文只聚焦于电力消耗。

将单次查询的能耗比作看 9 秒电视,听起来似乎微不足道。

但你看待这个问题的角度不同,得出的结论也天差地别。这个比喻巧妙地掩盖了一个事实:当微小的单次消耗乘以全球用户和天文数字般的日查询量后,总能源需求将变得无比巨大。

可一旦你算一笔总账,就会发现 Gemini 一天消耗的总电量,足以驱动一个印度小镇或村庄里 2,500 到 80,000 户家庭。

之所以范围跨度如此之大,是因为谷歌从未公布过全球日查询量的官方数据。有专家估算约为 10 亿次/天,也有保守估算为 2800 万次/天。

到 2025 年中,分析报告显示 Gemini 的日活跃用户在 3500 万到 4500 万之间。所以,2800 万是一个相对保守且现实的数字,但这仅仅是直接登录使用 Gemini 的用户。

如果算上 Gemini 在谷歌搜索、Gmail 等产品中的集成应用,专家相信每日总查询量会急剧攀升。

截至 2025 年,谷歌搜索每天要处理高达 130 到 140 亿次请求。

假设其中仅有 7-8% 的搜索触发了由 Gemini 驱动的 AI 概览功能,日查询量就已经轻松突破 10 亿次。

场景一:10 亿次查询,如何让 9 秒变成 8 万户家庭的日用电?

让我们基于全球每天 10 亿次查询来计算。

  • 每日总能耗:

    10 亿次/天 × 0.24 瓦时/次 = 2.4 亿瓦时/天。

  • 换算一下:

    这相当于每天 24 万千瓦时 (kWh)。

  • 这意味着什么?

    一个普通印度家庭日均用电约 3 千瓦时。因此,Gemini 一天的能耗足以支撑 8 万个印度家庭的日常用电。

这已经是一个小城镇的每日总耗电量。

如果用谷歌自己的比喻,Gemini 一天的总耗电量,相当于一个人不眠不休地看 285 年电视。

(285 年的计算过程:10 亿次查询 × 9 秒/次 = 90 亿秒,换算后约等于 285 年。)

保守场景:即便查询量降低,能耗依然惊人

现在,我们用非常保守的 2800 万次日查询量来计算。

  • 每日总能耗:

    2800 万次 × 0.24 瓦时/次 = 672 万瓦时。

  • 换算一下:

    这相当于 6720 千瓦时 (kWh)。

  • 这意味着什么?

    即便在如此保守的估算下,Gemini 一天也会吞噬掉足够 2240 个印度家庭运行的电力。

而这相当于连续观看 8 年的电视。

(8 年的计算过程:2800 万次查询 × 9 秒/次 = 2.52 亿秒,换算后约等于 8 年。)

现在,9 秒电视这个说法,听起来还那么轻松吗?

无论是乐观估计下的 8 万户家庭,还是保守估计下的 2240 户家庭,这些计算都揭示了一个残酷的现实:

那个让单次行为显得微不足道的比喻,一旦置于全球化的宏大尺度下,其真实影响便显得触目惊心。

同样,专家估算,你每向 Gemini 提一个问题,谷歌就要为此付出 0.5 到 3 美分的成本。

这听起来无足挂齿,但乘以数十亿的日查询量,就会累积成一笔让公司头疼不已的巨额账单。

那么,谷歌为何要强调单次查询这个视角?

从谷歌的角度看,这份报告的重点是展示其在提升效率方面的工程成就。它想证明自己已经成功解决了降低单次查询成本这一技术难题。

9 秒电视这个比喻非常奏效,因为它:

  • 贴近生活:

    让普通用户能直观感受到自己单次操作的微小成本。
  • 凸显进步:

    有力地证明了新模型和硬件相比过去有多么出色。

然而,这种叙事框架回避了一个更宏大、更复杂的问题:这项技术在地球尺度上的总体环境足迹。

对于谷歌和整个科技行业而言,真正的挑战,早已不是优化单次查询的成本。

真正的挑战是,如何用可再生能源去支撑由技术优化本身带来的指数级增长,并为其遍布全球的超大型数据中心提供源源不断的绿色电力。

参考资料:https://cloud.google.com/blog/products/infrastructure/measuring-the-environmental-impact-of-ai-inference

https://services.google.com/fh/files/misc/measuring_the_environmental_impact_of_delivering_ai_at_google_scale.pdf



一键三连点赞」「转发」「小心心

欢迎在评论区留下你的想法!


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
EMI
more
马斯克称特斯拉Semi将在明年开始大批量生产
再见了,Photoshop!谷歌发布 Gemini 2.5 Flash Image (纳米香蕉):一句话P图让Adobe彻底沉默
PaddleMIX推出扩散模型推理加速工具箱Fast-Diffusers:自研缓存加速方案实现2倍+提速
刚刚,谷歌「IMO金牌」模型上线Gemini,数学家第一时间证明猜想
深度研究模式|ChatGPT、Gemini、Claude大比拼:做深度市场研究,到底谁最强?
Gemini再揽金牌,力压大学学霸,AI数学推理时代来了!
SEMI-e 深圳国际半导体展半导体核心零部件产品合集:杰为科技、甲冠半导体、芯密科技、明睿陶瓷、槃实科技
谷歌Gemini一次提示能耗≈看9秒电视,专家:别太信,有误导性
AIR 科研|超越GeminiDiffusion,每秒推理速度2000+tokens,Seed Diffusion发布
台积电救场 Tensor,硬件只为 Gemini|Pixel 10 发布会速览
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号