刚刚,Grok 4 登顶全球AI之王!马斯克100万 GPU 豪赌强化学习之父理查德·萨顿“苦涩的教训”,AGI路线图越发清晰!

智能情报所 2025-07-10 15:44

Grok 4 已正式加冕,成为全球 AI 之王!

埃隆·马斯克在田纳西州孟菲斯的巨像超级计算集群(Colossus)上,为苦涩的教训这一理念下了一场惊天豪赌。现在看来,他旗下的 xAI 已经势不可挡。

正是这一招险棋,让 Grok 4 瞬间降维打击了所有其他前沿 AI 模型。

那么,究竟什么是苦涩的教训?它又为何能赋予 xAI 不可撼动的领先地位?


AI 研究的苦涩教训:简单、粗暴,但有效

苦涩的教训是 AI 研究领域的传奇人物理查德·萨顿在 2019 年提出的一个核心思想。它一针见血地指出:试图依赖人类的精巧设计和专业知识来指导 AI 发展,其实是一条歧途。

真正能创造奇迹的,反而是那些拥抱简单通用算法,并能最大限度利用海量算力和海量数据的笨方法。

这个教训之所以苦涩,是因为它让无数顶尖研究者难以接受一个残酷的现实:他们呕心沥血构思的精妙算法,在纯粹的蛮力计算和高质量大数据面前,常常不堪一击


xAI 的王牌:无可匹敌的算力霸权

现在,让我们回到马斯克的豪赌上。xAI 在算力和数据这两大支柱上,究竟有多强大?

在算力层面,xAI 已经建立了一个绝对的霸权。

他们打造了全球最大的单一英伟达计算集群,将超过 20 万块高性能 GPU 联结成一台巨型 AI 训练计算机。根据公开数据,到 2025 年 6 月,这台名为巨像(Colossus)的超算将配备 15 万块 H100、5 万块 H200 及 3 万块 GB200 GPU。

但这远未到终点。马斯克已公开表示,下一阶段的目标是建成一个拥有 100 万个 GPU 的超级集群,规模是现在的近 5 倍。

这一事实,对于全球所有致力于前沿 AI 研发的公司和国家而言,无异于一声惊雷。xAI 不仅已经拥有世界第一的统一训练集群,其扩张速度更是让所有对手望尘莫及。

马斯克雷厉风行的执行力,使他成为英伟达 CEO 黄仁勋最重视的客户之一。这意味着,当英伟达推出最新、最强的 GPU 时,xAI 总能获得优先供货权

更可怕的是,xAI 将新到手的 GPU 部署到集群中的速度,也远非其他公司所能比拟。

试想一下:凭借现有的巨大领先、马斯克无与伦比的融资能力、优先获得下一代 GPU 的特权,以及将算力光速转化为训练能力的执行力……还有谁能与 xAI 在算力上一较高下?

答案是,没有谁能。

当然,这并不意味着对手们已经放弃。OpenAI 的萨姆·奥特曼正在全力建设星际之门集群,并联合主权财富基金在中东布局,但这些项目的进度都远远落后于 xAI 的巨像。

这也揭示了 OpenAI 为何在察觉到算力优势即将旁落 xAI 之际,便迅速将战略重心转向推理模型——这本质上是将 AI 智能的生成压力,从资源密集的训练阶段,转移到了成本更可控的推理阶段。


破解数据瓶颈:从合成数据到多模态未来

但是,请记住,苦涩的教训有两个关键要素,算力只是其一。另一个要素——数据,又如何呢?

这恰恰是 xAI 面临的更棘手的挑战。

他们可以像所有竞争者一样爬取公开的互联网数据。他们还拥有 X(前推特),这是一个极其宝贵的实时文本数据金矿,尤其是在新闻和时事讨论方面。

但这足以喂饱那台巨大的算力怪兽吗?恐怕还不够。

为了填补数据鸿沟,并支撑未来更庞大的算力集群,xAI 的策略主要集中在两个方向:

  1. 大规模生成合成文本数据
  2. 拥抱更丰富的数据格式(音频、图像、视频)

1. 合成数据:用算力优势换取认知优势

合成数据是当前 AI 领域的绝对热点,而 xAI 也将大部分精力倾注于此,以扩充 Grok 4 的训练集。

数学、编程、逻辑推理和基准测试等领域,是合成数据最完美的用武之地,因为 AI 生成答案的对错可以被轻易、精确地验证。

  • 一道数学题,答案代入方程,成立或不成立,一目了然。
  • 一段代码,能无错运行,就是成功。

那么,xAI 在合成数据生成上有什么秘诀吗?从概念上讲,其实没有。真正的决胜点在于,谁能找到最高效的方法,让合成数据在训练中发挥最大价值

但别忘了,xAI 拥有压倒性的算力优势。 这意味着他们可以比对手更快地、更多地进行实验和迭代。即使他们最初的好点子密度不高,也能通过大规模的试错,比别人更快地逼近正确答案。

要一次就找对训练策略是极其困难的,即便是行业巨头也难免失手。据传,OpenAI 近期 GPT-4.5 的波折与 Meta Llama 4 的困境,都与训练设置中的战略失误有关。

xAI 的算力优势,让他们在使用前沿合成数据技术时,拥有了更多试射的机会。最终结果不言而明——Grok 4 展现出了超越所有对手的、强大的问题解决与推理能力。

2. 多模态:通往通用人工智能的必经之路

这正是马斯克和 xAI 正在全力冲刺的方向,其核心载体就是他们在Grok 4 发布会上多次提及的基础模型 7(Foundation Model 7)。

我们必须认识到一个基本事实:要传递相同的信息,音频和图像比文本需要更多数据,而视频的数据量则远超前两者。

AI 模型的发展,正如互联网的演进。互联网早期受限于带宽,内容以文本为主,后来才逐渐成熟到可以无缝处理音视频。AI 亦是如此。

尽管当前的多模态模型已具备处理音视频的能力,但这更像是模型在完成核心训练后外挂上去的功能,而非从一开始就根植于其核心训练数据中。

然而,如果我们的终极目标是通用人工智能 (AGI),那么地球上唯一的存在证明——人类,恰恰提供了相反的路径:

一个婴儿的神经网络,首先是通过海量的感官、音频和视频数据,建立起一个强大的世界模型,然后才在这个模型之上,叠加学习了语言的理解能力。

这与我们当前构建大语言模型的方式完全相反。

通过即将到来的基础模型 7训练,xAI 正朝着更贴近人类认知发展过程的训练机制迈出关键一步。使用更丰富的多模态数据,可以迅速满足其庞大算力集群对数据的渴求。这也是为什么他们计划在一个由 10 万块下一代 BG200 组成的全新集群上,训练其视频模型的原因。

之所以至今无人大规模这样做,是因为在复杂的 AI 训练流程中,处理如此海量的非结构化数据极其困难。

幸运的是,马斯克恰好是这方面的专家,这要归功于特斯拉在全自动驾驶 (FSD) 项目中积累的、关于视频数据训练的深厚经验。


结语:加速奇点

综合来看,xAI 凭借其绝对领先的算力优势,以及与特斯拉的独特协同,正处在将图像、音频、视频等丰富数据深度融入大模型早期训练的最佳位置。

通过这种方式,他们正在同时破解苦涩的教训中算力数据两大难题,朝着通用人工智能的奇点,全速前进。


本期推荐其他阅读:

马斯克2GW超级电厂曝光,为xAI的100万块GPU买下整座发电厂,AI巨兽Grok算力将无限,跨海搬运!

19世纪天才数学家遗作,竟藏着模拟大脑的钥匙?用0和1模拟大脑此路不通,SNAGs的60维结构隐藏在细胞数学中,未来计算机新方向

我们看了 78 个视频,统计了特斯拉 Robotaxi 在 100 次行程内的所有失误,结论:足够惊艳,但还不够省心


一键三连点赞」「转发」「小心心

欢迎在评论区留下你的想法!


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI GPU
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号