
新智元报道
【新智元导读】黄仁勋在两小时重磅访谈说了一件事:未来是可以被推导出来的。AI 算力正在重塑计算的本质,英伟达从造芯片变成造「Token 工厂」;AGI 已经到来,Agent 时代刚刚开始;智能会变成商品,人性才是稀缺品。他不怕死,只怕死前没把知识传完。
2026 年 3 月 23 日,黄仁勋坐进 Lex Fridman 的播客录音室,聊了两个多小时。

芯片、供应链、中国、死亡,他都谈到了。
以下是整场对话里最值得留存的 50 个判断,以及他用来支撑这些判断的核心逻辑。
1. AGI 已经来了
「我认为就是现在。我认为我们已经实现了 AGI。」
他的依据是:如果 AGI 的定义是「能运营一家市值超10亿美元的科技公司」,今天的 AI 已经做得到——创建一个病毒式传播的应用,短暂地烧出一家公司,再消失。
他没有回避这个定义的荒诞之处:「那一百万个 Agent 建出英伟达的概率是零。」
2. 他不想死,但做好了死在工位的准备
「我真的不想死。我有美好的家庭,有非常重要的工作。」
但关于接班人,他的答案是:持续传递知识。
「我希望自己死在工位上,最好是瞬间离去,不要有漫长的病痛。」
他认为与其焦虑接班,不如把每次会议都变成知识传递的机会。
「我学到的东西,在脑子里停留的时间不超过一秒,就已经传递给别人了。」
3. Vera Rubin 是为了养活 Agent
Grace Blackwell 机架是为大语言模型和推理设计的。
Vera Rubin 则完全不同——它多了存储加速器、全新 CPU「Vera」、独立的 Grok 机架。
变化只来自一个判断:Agent 要使用工具,要访问文件,要做检索,这需要一套完全不同的计算架构。
「上一代是为 MoE 大模型设计的,这一代是为 Agent 设计的,因为 Agent 要调用工具。」
4. 推理是思考,思考从来都不便宜
当年有人断言「推理芯片会是小芯片、便宜的芯片,英伟达的贵芯片只用于训练」。
黄仁勋觉得这个逻辑根本立不住:「推理就是思考,而思考比阅读难得多。预训练是记忆和泛化,是在找规律;推理是在解决从未遇到过的问题。」
测试时扩展是计算密集型任务,这一点他从未动摇过。
5. 扩展定律现在有四条
预训练扩展(数据越多越聪明)、后训练扩展(合成数据持续规模化)、测试时扩展(推理即思考)、智能体扩展——「扩充员工比提升我自己容易得多」。
四条定律形成闭环:Agent 产生的数据流回预训练,经后训练精调,再经推理增强,再释放到产业。
「归根结底就是一件事:智能的规模由算力决定。」
6. Vera Rubin 在两年前就已注定
推断出 Agent 需要什么样的计算架构,并不需要什么神机妙算,只是推理。
「如果我想让大模型成为一名数字员工,它需要做什么?访问文件、做研究、使用工具。」
两年前 GTC 上他展示的 Agentic 系统架构图,和今天的 OpenClaw 几乎完全一致。
「有时候不是预见了未来,是推导了未来。」
7. 合成数据不是旁门左道
「人们忘了,我们彼此传授和交流的大多数数据本来就是合成的——不是从自然界直接生长出来的。你创造它,我消费它,我修改它,别人再消费它。」
AI 用合成数据训练 AI,和人类长久以来的知识传递方式并无本质区别。
8. 「预训练终结论」是一次误报
Ilya Sutskever 说「我们没有数据了」,业界一度恐慌。
黄仁勋不以为然:预训练的瓶颈从数据转移到了算力,「因为未来绝大多数训练数据将来自合成」。
训练的极限从来不是数据,只是算力。
9. Agent 是 Token 的 iPhone 时刻
「Token 的 iPhone 时刻到了。」
他说的不是某个具体产品,而是 Agentic 系统这个范式。
「它是历史上增长最快的应用,直接往上冲。」
增长曲线本身就是答案。
10. OpenClaw 做到了 ChatGPT 当年做到的事
OpenClaw之所以引爆全球,是因为普通消费者能直接触达。
「它对 Agentic 系统的意义,就像 ChatGPT 对生成式 AI 系统的意义。这是大事。」
11. 智能是商品,人性才是稀缺品
「我一直认为智能是商品。」
在公司,他身边坐着 60 位在各自领域比他更专业的人,但他坐在正中间指挥这一切。
「这就是洗碗工坐在一群超人中间的问题。」
智能可以规模化,但人性、品格、同理心、慷慨无法被量化。
「我们应该把更重要的位置留给人性,而不是智能。」
12. CUDA 的安装基础才是英伟达最深的护城河
不是最好的芯片,不是最先进的架构,而是几百万开发者在 CUDA 上叠了几十年的软件积累。
「开发者选择 CUDA,是因为它在所有云、所有国家、所有行业都有部署;是因为他们相信英伟达会把 CUDA 一直维护下去。」
信任是技术护城河之上更深的一层。
13. 生态定义架构,不是优雅程度
x86 从来不是最优雅的架构,那些被精心设计的 RISC 架构几乎全军覆没。
「有史以来批评声最大的架构是 x86,但它是今天的定义性架构。」
生态比设计哲学更持久。
14. CUDA 曾让英伟达市值从 80 亿美元跌到 15 亿
把 CUDA 塞进 GeForce,让消费级显卡承担计算平台的成本,使当时毛利率只有 35% 的英伟达几乎耗尽利润,市值从约 80 亿美元跌到 15 亿。
但这正是必须做的:「没有安装基础,就没有平台。」
15. 研究者通过 GeForce 发现了英伟达
许多大学研究者本来就玩游戏,在实验室用消费级零件攒集群。
把 CUDA 装进每一台 GeForce,相当于把一台超算交到每个研究生手上,等待「某件惊人的事情发生」。
深度学习革命,就是那件事。
16. 他从不搞「大改革宣言」
很多 CEO 学到新东西,就发表宣言、重组架构、换 Logo。
黄仁勋的方式是:悄悄地、持续地塑造身边所有人的信念。
「等到我宣布收购 Mellanox 的那天,每个人都觉得这太理所当然了。」
领导力有时看起来像是跟在后面,其实是提前把路铺好了。
17. 公司架构应该反映它生产的东西
他说所有公司的组织架构图看起来都一样——「这对我毫无意义。」
公司架构应该反映它所处的环境和它想生产的产品。
英伟达直属汇报有 60 人,没有一对一,只有集体攻坚。
18. 60 个直属汇报,不开一对一
原因很简单:极度协同设计要求所有人同时听、同时能插话。
「讨论散热的时候,负责内存的人可能发现有问题——他必须在场。」
19. 一切从物理极限倒推
「速度极限」是他三十年前就开始用的方法论:在动手之前,先搞清楚物理定律允许的边界在哪里。
内存速度、计算速度、成本、功耗、制造周期,都要和这个极限对比一遍,再谈权衡。
「做好一件事今天要 74 天,我不想听花费 72 天的改进方案——我想知道从零推导,至少需要几天。」
20. 持续改进是懒惰,从第一性原理重建才是认真
「先告诉我为什么是 74 天。再告诉我从零开始,最少要几天。很多时候答案是 6 天。然后我们再讨论从 6 天到 74 天之间的每一个妥协——至少我们知道那些妥协是什么。」
21. 英伟达把 AI 算力提升了一百万倍
过去十年,摩尔定律让算力提升了约 100 倍。
英伟达通过极度协同设计把 AI 算力提升了一百万倍。
「我们会继续推进,每年把每瓦 Token 数量提升几个数量级。」
22. Token 成本每年下降一个数量级
硬件在涨价,但 Token 生成效率提升得更快。
「我们的计算机越来越贵,但产生每个 Token 的效率提升速度远超硬件价格的涨幅。」
23. 电网有大量闲置容量,可以被 AI 用起来
电网是按最坏情况设计的,而最坏情况每年只出现几天。
其余 99% 的时间,电网在空转。
黄仁勋的建议是:数据中心与电网签柔性合约,在极端天气时自动降速或转移负载,平时享用那些本来就闲置的电力。
「我只是想用他们本来就在浪费的那部分。」
24. 六个九的可靠性要求正在绑架电网
CEO签多年合同,要求数据中心六个九(99.9999%)的可用性,这个要求层层传导到电力公司。
「我打赌那些公司的 CEO 根本不知道他们的采购团队签了什么。」他想让所有相关方的CEO都意识到这件事,然后重新谈。
25. 马斯克体现了「亲自到场」的力量
四个月,在孟菲斯建起了 20 万张卡的集群。
黄仁勋理解其中的方法:一切追溯到必要性;亲自出现在问题现场;用个人的紧迫感驱动整个供应链把你排在第一优先级。
「他让每个供应商都明白,他们眼下最重要的项目就是这个。」
26. 放射科医生的故事
AI 视觉 2019 年已经超越人类,当时预测放射科医生会消失。
结果:放射科医生数量反而增加了,现在还短缺。
「因为扫描分析速度变快了,医院能接诊更多病人,于是需要更多放射科医生。」
工作的目的和完成工作的工具,不是同一回事。
27. 英伟达的软件工程师数量会增加,不会减少
「我想要的是他们解决问题,我不在乎他们写了多少行代码。」
诊断问题、评估结果、创新、连接信息——这些不会消失。
28. 「会编程的人」从 3000 万扩展到了 10 亿
如果编程的本质是「描述规格」,那么所有能用自然语言说清楚自己想要什么的人,都变成了程序员。
「每个木匠将来都是程序员,而用上 AI 的木匠同时也是建筑师。」
29. 所有职业都在被「抬高」,而非被取代
会计师变成了财务分析师兼顾问;木匠变成了设计师;水管工能给客户提供更完整的方案。
「如果我是水管工,我会为 AI 兴奋得发狂——能给客户的服务太多了。」
30. 焦虑的正确处理方式:拆解,然后行动
面对不确定,他的方法是:拆解问题,分清哪些能做、哪些不能做,然后只对能做的那部分负责。
「推导出要做什么,却没做,也没让别人做——那就别抱怨了。」
31. 遗忘是一种能力
「AI 学习中最重要的属性之一,就是系统性遗忘。」
人也一样。
「把担忧说出来就是在分担它,说完就忘掉。」
他不背负过去的失败,只追下一个亮光。
32. 「这能有多难」是一种超能力
他经常对自己说的话是「这能有多难?」。
这是刻意维持的心理状态:不要在出发前把所有可能的挫折都预演一遍,否则根本不会出发。
「真正的韧性是在挫折真的来临时启动的,不是在出发前就消耗掉的。」
33. 对尴尬的耐受力,是领导力的底层能力
当众推理、当众犯错、当众被纠正——这需要持续的练习。「他们知道我第一份工作是刷厕所。」
34. 财富和权力没有让他更难被说服
「因为我大部分工作都在公众面前进行,当我错了,几乎所有人都看见了。」
当错误是公开的,谦逊便不再是选择,而是必然。
35. 台积电最重要的资产不是工艺,是制造体系和信任
很多人以为台积电的护城河是工艺节点。
黄仁勋认为,协调几百家客户的动态需求、同时维持良率和交货承诺,这才是真正无法复制的东西。
「我们没有合同,三十年,几千亿美元的生意。」
36. 张忠谋曾邀请他执掌台积电
2013年,台积电创始人张忠谋邀请黄仁勋接任 CEO。
他拒绝了:「我已经看到英伟达要成为什么,这是我一个人的责任,我没办法离开。」
37. 英伟达没有可以抢的市场份额
「如果英伟达是家 100 亿美元的公司,想从竞争对手那里抢份额,投资者很容易算清楚。但我们很难被估值,因为我们要创造的市场基本上还不存在。」
想象力,是这种公司最重要的分析工具。
38. 算力单元的演进:芯片→集群→工厂→星球
他现在脑子里的「一台计算机」,是一个消耗吉瓦级电力、有上万人在安装、需要数千工程师才能开机的庞大基础设施。
「下一次跃迁,我希望脑子里的单位变成星球级别的计算。」
39. 英伟达每周生产约 200 个 Vera Rubin POD
每个POD有 40 个机架、60 exaflops 算力、10PB/s 带宽——「这只是一个POD」。
40. 供应链有 200 家供应商,每个机架 130 万个零件
这种复杂度让「在数据中心内部组装」变得不可能——NVLink 72 必须在供应链里完成超算组装,整机出货,每个机架两三吨地运过去。
41. 他三年前就说服了存储厂商押注 HBM
当时 HBM 只在极少数超算里出现,他对几家 DRAM 公司的 CEO 说:「这会成为数据中心的主流内存。」
一开始对方觉得荒唐,但几家信了,投了。
「告知、塑造、激励——这是我工作的一部分。」
42. 中国是当今世界创新速度最快的国家
全球 50% 的 AI 研究者是中国人。
中国科技产业在移动互联网时代崛起,天然擅长软件。
不同城市之间的竞争制造出残酷的淘汰压力——「留下来的都是了不起的公司」。
工程师文化、开源文化、同学式的知识共享,共同推动了这个速度。
43. 中国工程师更愿意开源,是因为对面公司坐着他们的同学
「他们在保护什么?」
黄仁勋解释这背后的逻辑:竞争对手那里有你的同学,另一家公司里有你兄弟,知识共享比保密更自然。
44. GeForce 至今仍是英伟达最重要的营销手段
「人们在少年时代认识英伟达,之后上大学,然后用 CUDA,然后用 Blender,然后做 AI。」
消费级显卡是品牌进入下一代工程师认知的通道。
45. DLSS 5 不是 AI 修图,是给艺术家的工具
这其中的争议在于玩家担心游戏被 AI「改造」成千篇一律的风格。
黄仁勋澄清:DLSS 5 受原始几何体约束,「每一帧都以艺术家定义的纹理和风格为条件,我们只是增强,不改变任何东西。」
46. 史上最有影响力的游戏是《毁灭战士》(Doom)
「从文化冲击和把 PC 从办公工具变成家庭娱乐设备这两个维度,答案是《毁灭战士》(Doom)。」
47. 芯片不会「紧张」,而人会
「我不知道芯片是否会紧张。」
正是这种紧张感,以及这种感觉在人类表现中制造的巨大差异,让人类的主观体验无法被简单复制。
「同样的处境,两台计算机产生的差异来自统计,不是来自感受。」
48. 理解生物机器,大概在五年内
「不是十年,大概是五年。」
他认为神经科学和理论物理学的重大突破都在视野之内。
「解释意识,那会很了不起。」
49. 他想意识上传后,让人形机器人带他去宇宙深处
「我说过的一切、写过的一切,都已经在互联网上了,正在变成我的 AI。到时候把这些以光速发出去,追上我的机器人。」
这是他认真描述的规划。
50. AI 会让人类更珍视人类本身
「我们应该把最重要的位置留给人性、品格、慷慨、同情——而不是智能。」
AI 让智能变成了商品,也正因为如此,把人从「够不够聪明」的焦虑里解放出来,让人重新面对那个真正难以被复制的部分:做人本身。