李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众

APPSO 2025-12-05 18:53
李飞飞说,她现在可能是 AI 圈里「最无聊」的那个人。
因为别人都在聊「人类将灭绝」、「无限生产力」,而她只想泼冷水:这些两极分化的极端言论,正在误导大众。一边是末日论,一边是乌托邦,真正该被讨论的事实反而没人说了。
在斯坦福经济政策研究论今天正式公布的论坛视频中,李飞飞发表了如上言论。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众图1
 
在她看来,25 年前她进入这个领域时,正值 AI 寒冬,没光环、没钱、没人关注。现在 AI 成了「文明级别」的技术,但她最失望的恰恰是行业里满天飞的极端言论。
她更关心的是另一件事:空间智能。
人类光靠「说话」灭不了火。开车、做三明治、拥抱孩子,这些动作都和语言无关,而是和视觉、几何、空间、操作有关。李飞飞认为,如果说大语言模型已经打赢了第一仗,那么下一章就是空间智能,也就是让机器真正能「看见」和「行动」。
她刚创立的公司 World Labs 已经推出了首个空间智能模型 Marble,能生成真正的 3D 空间。创意行业、教育、机器人、模拟训练,都会因此改变。当然,就像当年自动驾驶的承诺一样,这条路显然没那么好走。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众图2
 
省流版如下:
 
1. 拒绝两极化炒作,呼吁回归理性
李飞飞承认 AI 发展快得惊人,但极度反感当前舆论场中「末日论」(人类灭绝)和「乌托邦论」(无限繁荣)并存的极端现象。她认为这会误导缺乏 AI 素养的公众,呼吁大家关注技术本身对普通人生活的实际影响,而非沉溺于夸张的预测。
2. AI 的下一个前沿是「空间智能」(Spatial Intelligence)
她指出,智能不等于语言(大模型)。人类进化的核心是视觉与行动,而非单纯的语言。AI 的下一阶段必须突破「空间智能」,即让机器具备在三维世界中感知、推理和行动的能力。这将彻底改变机器人、创意制作和模拟训练领域,比语言模型更具挑战性。
附上视频地址🔗 :
https://www.youtube.com/watch?v=7fcbY3tAJ9I
25 年前的 AI 寒冬,和那个以为要等 100 年的梦想
Neale Mahoney:在晚宴前的最后一个环节,我非常高兴邀请到李飞飞来到现场。先简单介绍一下她的背景,然后我们再进入问答环节。李飞飞是斯坦福大学的计算机科学教授,担任红杉资本冠名席位,同时也是斯坦福以人为本人工智能研究院的联席院长。大家常常亲切地称她为「AI 教母」,我也不确定她是否完全接受这个称号。
李飞飞主导创建了 ImageNet 项目,这个项目为数百万张图片打上标签,被广泛认为是推动现代 AI 革命的关键起点。她一直致力于推动人工智能朝着改善人类福祉的方向发展。她不仅是我个人的灵感来源,也是斯坦福众多同事和全球无数学生的榜样。
我想先从一些宏观层面的问题开始,然后我们再深入探讨。自从你创建 ImageNet 以来,你一直处在 AI 发展历程的第一线。
回顾这一路的发展,你觉得这条路上有什么让你感到惊讶的地方?又有哪些是像你这样的技术专家可以预见的?有没有什么事情让你感到失望?我们是不是还能走得更快?
李飞飞:谢谢你,Neale,也谢谢在场的各位。能来到这个会议我始终感到非常荣幸。其实我是在整整 25 年前进入人工智能这个领域的,那时正值 AI 寒冬。我当时成为了一名博士生——我们现在还会说一个老段子,「我们会在解决 AI 问题之前,先把自动驾驶解决了」。
在 AI 寒冬时期作为博士生进入这个领域,完全是出于个人的好奇心。那个时候没有什么光环,也没有资金支持,更没有产业关注。但作为学生,我对那些最大胆的问题充满好奇,比如「什么是智能?」、「机器能否思考和行动?」这些问题深深吸引了我。
我受到物理学和其他科学革命的启发,在我看来,人工智能正是关乎人类的一个最宏大的问题。从这个角度来说,25 年过去,AI 发展成一种「文明级别」的技术,其实并不让我感到惊讶。因为我真心相信,人工智能是一种关乎整个人类文明的技术,它的能力一旦被真正释放,将带来深远影响。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众图3
但我必须承认,即便对像我这样的技术人员来说,AI 的发展速度在某些时刻也远超预期。我第一次真切感受到这种「飞速发展」的时刻,是在 2015 年左右。当时我有一位研究生——他现在已经非常有名了。
他的名字叫 Andrej Karpathy,他的 Twitter 粉丝比我多多了。当时我们一起做了一系列关于「图像描述」的研究,也就是让计算机看到一张图片之后,能够用一句话或两句话来描述图中内容。
相比现在的生成式 AI,当时的图像描述内容还比较简单,不会生成很长的段落,但它已经能够理解图片中不只是「有一把椅子」、「有一只猫」,还能说出背后的情境,比如「两个人在台上对观众讲话」。这种理解能力,让机器能够「讲故事」。
而我刚读博时的梦想就是,希望在有生之年能看到计算机具备这种视觉理解和讲故事的能力。当时我以为,这个目标至少要 100 年才能实现。我甚至以为自己退休的时候,如果我们这个领域能攻克这个难题,那我就很自豪了。
但 2015 年,我和 Andrej,还有一些学生们做的这项研究,基本上已经解决了这个问题。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众图4
而且那时候还没有生成式 AI 的概念。这是我第一次真正体会到技术进步的飞快。与此同时,我也感受到了产业的迅速介入。在我职业生涯的前期,AI 还是一个非常理想化的学术问题,只有学界和极少数企业实验室在探索。我们学术圈的人开个会,能有 500 人来就很开心了,互相交流论文。
但到了 2015 年,当我和 Andrej 做图像描述时,我们已经在和 Google 竞赛了。我们几乎在同一时间达到了相同的技术水平。虽然我为此感到非常骄傲,但也很明显,产业已经开始迅速发力。
当然,对我们这些技术专家来说,第二个重大惊喜是大语言模型(LLMs)的强大能力。其实我们早就知道相关技术正在发展,比如 Transformer 论文的发表、规模化训练、算力的提升、神经网络架构的优化等等,我们也理解这些发展趋势。
但真正看到大型语言模型落到普通用户手中,并且以如此快的速度变成一股改变整个行业的力量,这对我们所有人来说,都是一个重大的启示。确实,这一路上有很多惊喜。你要我谈谈失望的部分吗?
AI 圈最无聊的人,给末日论和乌托邦泼冷水
Neale Mahoney:我们当然可以聊聊失望的地方,也可以聊聊以人为本的研究院使命。你可以自己选个方向,我们该聊哪一个?
李飞飞:其实它们可能是相关的。我常开玩笑说,我现在可能是 AI 领域里「最无聊」的讲者,因为我真正的失望,来自于现在这个领域里两极化的夸张言论。
我之所以深爱这个科学领域,是因为它曾充满敬畏之心。作为一名科学家,我一直对 AI 保持着敬重之情——对真理的追求、对创新的坚持、严谨的评估与辩论,把这门学科当作真正的科学来看待。
但如今,AI 早已不仅仅是科学,它已经成为一股全面提速的产业力量,而随之而来的,就是两端极端化的夸张言论。
一方面,是那些关于「人类将灭绝」、「世界末日降临」、「P(doom)」之类的言论。关于「AI 将统治人类」、「机器变成主宰」的言论层出不穷。
(APPSO 注释:P(doom)是指文明因失控的高级人工智能导致灭亡或发生灾难性结局的概率。换句话说,它是一种对 AI 发展会不会带来毁灭性后果的主观概率评估。)
说实话,我对那些富人和上位者说这些并不太在意。我真正在意的是,当社会中那些弱势群体听到这些言论时,会受到怎样的影响。而另一方面,则是极端的乌托邦式幻想,比如「丰饶时代」、「无限生产力」等。
作为一名学者、技术人员,说到底也是作为一个世界公民,我认为我们必须以理性和清醒的态度去看待每一次技术变革、每一项工具。这是一种工具,是非常强大的工具,是一把双刃剑。我们人类必须负起责任,用它去做好事,为善治理,同时也要防范它被滥用,或带来意料之外的后果。
如今充斥在公众舆论空间里的这些极端言论,其实正是在这个关键时刻误导大众。
而当下,全球大多数人——特别是那些不在硅谷的人——更需要听到的是事实,需要真正了解这项技术到底是什么,它会如何影响他们的生活,影响他们孩子的未来,影响他们所在社区的走向。然而,这样的对话、这种沟通,这种面向公众的教育远没有达到我所希望的程度。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众图5
Neale Mahoney:我想这些话题我们可能可以聊上几个小时,但毕竟时间有限。所以我想转向另一个你同样在引领的方向——空间智能(spatial intelligence)。我想,对我自己来说,对在座的很多人来说,提到 AI,首先想到的可能是大语言模型(LLMs):你输入一段文字,它在框里返回一段文字。
而你曾提出,空间智能将是 AI 的下一个前沿。你能解释一下什么是空间智能吗?也能举一些具体的例子吗?
李飞飞:什么是空间智能?为什么我认为它是 AI 的下一个前沿方向?
这其实回到了最基本的认知原则——智能本身是非常复杂的,它并不只是语言层面的。如果你看看人类的智能,从上世纪 60 年代心理学家提出的「多元智能理论」到我们日常生活中的常识,就能发现这一点。你们今天有多少人是自己开车来的?有多少人今天做了三明治?有多少人拥抱了自己的孩子?这些行为都不属于语言范畴。
我常开玩笑说,你光靠「说话」是灭不了火的。我们人类的智能、我们的发展,极大程度上依赖于我们的感知能力、推理能力,以及我们「做事情」的能力,比如移动、互动等等。哪怕只是拿起一杯水的动作,也和语言无关,而与几何、空间、视觉、操作等等密切相关。
这些,就是我所说的「空间智能」。它是一项核心技术,能把「看见」与「行动」、「感知」与「推理」、「想象」与「创造」连接起来。
从人类发展来看,我们出生后的前两年基本上都是「前语言期」;再看动物智能的演化,大约 5.4 亿年前动物才开始拥有视觉感知,第一次看见光。而从那时起,生物用了将近 5 亿年才发展出我们现在这样的视觉复杂度、灵巧度和创造力。而语言作为进化的产物,其实只存在了几十万年。
所以,智能中很大一部分其实是非语言的。如果我们能解锁空间智能,会发生什么?从根本上讲,这将彻底改变「讲故事」的方式,进而推动创意领域的发展,比如电影制作、游戏、沉浸式体验、教育等。它还会彻底改变仿真技术和机器人领域,影响设计,甚至对商业、医疗、市场营销、科学发现等领域产生深远影响。
这也是我真正感到兴奋的地方。因为在语言智能领域,我们这个学术界(我不是说我自己,而是整个领域)已经完成了一场巨大的革命。而我认为,下一章的重点,正是空间智能的解锁。
Neale Mahoney:那我想进一步追问一下,也许是我有点天真,但空间智能似乎对大语言模型来说特别难。我们有一个庞大的训练数据集——互联网。但我还记得当年有人信誓旦旦地说,到 2018 年,自动驾驶就会让所有卡车司机失业。
李飞飞:是啊,我也记得那些说法。
比自动驾驶还难?World Labs 和那个叫 Marble 的模型
Neale Mahoney:我们现在在帕洛阿尔托也才刚开始真正看到自动驾驶汽车的应用。那么对于普通消费者、日常用户来说,空间智能方面的首次突破会出现在哪里?你最看好哪个方向?或者你并不认为这是一个更难攻克的难题?
飞飞:我认为这确实是一个更难攻克的问题——事实上,语言智能比空间智能先取得突破,本身就说明了这一点。你说得没错,互联网上大量可用于语言学习的数据,是(如果不是最主要原因的话)让大语言模型如此强大的重要原因之一。
不知道大家有没有读过一篇非常有名的论文,叫《The Bitter Lesson(苦涩的教训)》,作者是 Rich Sutton。里面提到的「苦涩教训」是:在有大量数据的地方,我们往往能在 AI 领域实现突破性进展。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众图6
如今我们确实在互联网上拥有大量视频数据。但空间智能并不只是视频这么简单,它是三维的,如果再加上时间维度,那就是四维的。从技术角度来看,事情要复杂得多。
我现在运营一家初创公司,叫 World Labs。
我们是第一家将空间智能模型真正带入公众手中的公司。我们开发了一个名为 Marble 的空间智能模型,它是一种「世界模型」(World Model),能够真正生成 3D 空间。要做到这一点,我们花了很多功夫,采用了一种混合式的数据处理方法。
你说得非常对,Neale,我们都记得当年自动驾驶的热潮,对吧?2017 年、2018 年,几乎每家汽车公司都承诺很快会实现 L4 级别的完全自动驾驶,而现在,我们只是刚开始看到有限场景下的 L4 自动驾驶。我认为,空间智能的突破之路也将是一段需要时间慢慢走的旅程。
目前我们已经开始看到它的一些二维版本的应用,大家都很喜欢「MidJourney」这个 AI 工具;昨天 Nano Banana 也让大家非常开心。我相信你们也做了不少 meme(笑)。我们已经能窥见视频生成的潜力。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众图7
但如果从真正意义上的空间智能,也就是三维世界建模的角度来看,我认为「创意」和「讲故事」可能是最早受益的行业之一。因为目前创建 3D 场景来讲故事的过程非常痛苦,有很多人要花费数小时,甚至数天,只为了做出一个 3D 素材。而空间智能可以大大简化这个过程。
你们如果去我们公司官网,可以看到一些实际的应用案例。我还认为,这项技术会对「模拟训练」和「机器人学习」产生深远影响,这些领域目前的数据瓶颈非常严重。
此外,我个人也已经看到这项技术在教育领域的一些初步应用案例,这让我特别兴奋。因为这项技术可以为学生提供一种完全不同的学习体验。
Neale Mahoney:太好了,我接下来想问一个问题,可能是我们两人都可以回答的,然后我会把时间交给大家提问。
我觉得斯坦福的一大优势就是不同学院和学科之间的合作,那么你认为计算机科学家和技术人员,怎样能更好地与经济学家合作?希望我们今天只是这个话题的开始,而不是结束。
李飞飞:是的,首先我完全同意你说的。
从技术影响到经济影响,AI 正在深刻改变每一个行业、每一个经济和社会科学的维度。这种影响是巨大的。你说得也对,我听说斯坦福是全美唯一一所几乎所有学院都排名前列的大学,而且所有学院之间步行可达。除了今天,基本上一年有 362 到 365 天阳光明媚(笑)。所以,斯坦福这种跨学科、多学科的文化和合作机会,真的非常了不起。
我们当中很多人之前在其他大学读书或工作过。我个人觉得,能在斯坦福工作是非常难得的机会,正是因为这里有这种学术交融的环境。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众图8
Neale Mahoney:有你在这里真的太好了。我想再补充一句,然后就开放提问。有时候我开玩笑说,但其实也挺认真的:经济学家往往是「我们应该在五年或十年前制定的政策」的专家——因为我们通常要等到现在才拿到数据,然后还要花很久写论文、发表文章。
但如果我们在 AI 这个领域也落后五年、十年,那我们就真的辜负了这个专业,也辜负了社会。我认为,要让我们的研究和现实保持同步,唯一的办法就是多来找你们,向你们学习,比如关于空间智能以及 AI 的下一个方向。
希望我们能继续保持这种合作。现在我想把时间交给现场提问。我知道李飞飞今天还要带女儿去看演出,她身兼多职,同时也是一位很棒的妈妈,所以我们不能耽误她太久。
李飞飞:哈哈,那确实是个问题。这几周我真的工作太多了。
Q&A 现场提问
Neale Mahoney:好的,有问题的朋友现在可以提问了。我们从后排这位有麦克风的同学开始。
提问者:我对 AI 素养(AI literacy)非常担忧,特别是那些您刚才提到的,不在斯坦福、不了解 AI、但却会深受影响的群体。您怎么看 AI 素养的问题,以及如何实现 AI 带来的公平成果?
李飞飞:我认为 AI 素养至关重要,谢谢你提到这个问题。
我一直在强调,公众教育是当下这个时代最重要、但也最被低估的关键任务之一。坦率地说,我确实认为斯坦福 HAI 在公众教育方面肩负着特别重大的责任。我们不能满足于只教育这四年里的本科生和研究生。作为全美乃至全球最顶尖的学术机构之一,我们拥有大量理解这项技术及其影响的人才,我们必须通过各种方式去建立合作、开展教育。
坦白说,我认为我们所有的同事,如果能共同发声,呼吁政策圈、商界等其他领域重视公众教育和 AI 素养的缺失,这将是改变的开始。
李飞飞炮轰 AI 圈两大乱象:要么贩卖恐慌,要么画饼充饥,都是误导大众图9
Neale Mahoney:我完全同意。那我们再来看这边的提问。
提问者:你好,我是来自丹麦驻硅谷科技大使办公室的 Klaus。我也对空间数据非常感兴趣。我想请问一个问题:在空间智能方面,是否有哪家公司拥有明显优势?比如说特斯拉,它通过汽车收集了大量的数据。
李飞飞:特斯拉是一家汽车公司,现在当然也在向机器人领域拓展。它确实在「移动性」这条路线上有自己的独特优势。但空间智能远不止于「驾驶」。
我不想一味地提自己公司的名字(笑),不过你可以去我们官网看看。空间智能的应用远远超越了驾驶,涉及创意、教育、设计、交通等多个领域。
Neale Mahoney:还有一位年轻的朋友,我又见到你了。
提问者你好,我来自美国加州人工智能政策研究院(Institute for California AI Policy)。我有一个与政策相关的问题。您刚才提到了空间智能,那我们需要制定什么样的政策,才能充分释放空间智能的潜力,同时避免其潜在的危害,比如生成式 AI 或其他类型的 AI?
李飞飞:谢谢你,这个话题真的可以聊上几个小时。我简单说一下我的看法:我们需要的是一个健康的 AI 生态系统。
我对此非常担忧。我担心垄断问题,担心创业机会的缺失,更深切地担心公共部门资源的不足。我担心美国在创业方面面临的困难——要知道,美国今天的科技优势,正是建立在几十年前对公共部门、学术界、创业生态和企业的大量投入之上。
而现在,AI 的发展正呈现出资源高度集中的趋势——不论是电力资源、芯片资源,还是人才资源。与此同时,美国公共部门的资源却在不断萎缩。如果这种趋势持续下去,将在未来多年、甚至几十年内造成严重的负面影响。
Neale Mahoney:我们确实该让你赶紧走了。大家用热烈的掌声感谢李飞飞的精彩分享吧!

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
首款豆包AI手机售罄:二手价最高超万元,租赁单日报价600 元
不做外卖不谈 AI,拼多多暗渡陈仓
知名数学家辞职投身AI创业:老板是00后华人女生
夸克 AI 眼镜 S1 体验:超越 Meta 的决心,以及方法论
不只理想夸克,我们还有7家大厂AI眼镜的独家消息
iPhone Air成苹果最不保值手机;黄仁勋:4点起来工作,子女不敢懈怠;影翎全景无人机正式上市,6799起售 | 极客早知道
豆包手机助手再回应:调整AI操作功能/Netflix宣布827亿美元收购华纳兄弟/饿了么正式更名为淘宝闪购
腾讯研究院AI速递 20251204
一句话生成应用!灵光AI已被网友玩疯,两周狂产330万
做AI眼镜,为何Rokid乐奇能成为大厂们的学习对象?
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号