
作者 | 常博硕
编辑 | 杨锦
9月11日,上海外滩大会正式开幕。
在开幕式暨主论坛上,2024年图灵奖得主、加拿大计算机科学家理查德·萨顿从人工智能的科学发展趋势,政治影响,以及哲学意义三个角度分享了他眼中的人工智能。
萨顿认为,今天大多数机器学习的目的,是把人类已有的知识转移到一个静态、没有自主学习能力的AI上。但是,随着人类逐渐开始达到数据的极限,这种方法已经无法生成新的知识。萨顿进一步解释道:“移植人类已有的知识并不适合人工智能持续学习,而持续学习对智能的效用至关重要。”
基于此,萨顿分享了一名播客主持人Dwarkesh Patel对大语言模型的看法。Dwarkesh Patel曾在播客中说:“大语言模型并不会随时间推移而变得更聪明,这和人类不一样。这种缺乏持续学习能力的情况,是一个非常大的瓶颈。在很多任务上,大模型的基准表现可能优于人类的平均水平,但我们没办法给模型提供高层次的反馈,只能接受它本身自带的能力,只能不断调整提示词。但在实践中,这根本达不到人类那种学习和进步的程度。人类真正的优势,并不在于单纯的智力极限,而在于他们能够不断积累上下文,反思失败,并在实践中一点点改进、提升效率。”
那么所谓“智能”,究竟是大量知识的积累,还是快速学习的能力?在萨顿看来,智能的定义在衡量的是学习的速度,学习速度是构成“智商”的关键。
萨顿说:“现在我们正进入经验时代,我们需要一种新的数据源,它随着智能体的变强大而不断增长和完善,就像电脑游戏中的自我博弈一样。这类数据也可以不依赖自我博弈,而是由智能体以第一人称与世界互动直接生成,我称之为经验。”萨顿所描绘的“经验”,正是人类的学习方式,是 AlphaGo 创造第“37 步”的方式,也是 AlphaProof 近期在国际数学奥林匹克中获得了银牌的方式。
为了解释经验数据的重要性,萨顿又举了一个例子。“如果你观察婴儿与各种玩具玩耍的视频,我们会看到他所获取的数据,取决于他自己的一举一动。孩子和这个玩具玩一段时间,然后转向下一件玩具,他获得的数据由他的行为决定。”他进一步指出,“关键在于,我们需要与智能体的智力水平和认知发展相匹配的数据。”
萨顿这里说的“经验”,可以具体解读为三要素:观察、行动和奖励。“这三种信号在智能体与世界之间来回传递,这就是我定义的经验。所以我很笃定认为,知识来自于经验,因此可以从经验中学习。一个智能体的智能程度,取决于它能预测并控制自身输入信号的程度,特别是奖励信号。”进一步来看,萨顿所描绘的经验学习正是强化学习的思维逻辑。
萨顿总结道:“在人工智能未来的科学趋势上,如果能创造出超级智能体和由超级智能增强的人类,将为世界带来纯粹的福祉。”“完全智能的智能体必须从经验中学习,这已经超出了大语言模型的范畴,将作为世界知识的可定制接口。”
除了人工智能的发展趋势之外,萨顿也谈到了人工智能带来的政治影响。萨顿观察到:“除地缘政治之外,公众担心人工智能会带来偏见、失业甚至导致人类灭绝,一些国家正在陆续立法,限制人工智能模型的能力,更有人呼吁暂停人工智能研究,将其与核武器和生物武器相提并论。”
随后萨顿分享了自己的想法:“我的观点是,这种对人工智能的恐惧被夸大了,并且是被某些从中获利的组织和个人煽动起来的。但实际上,这些问题与人类几千年来一直在应对的挑战并无不同。”
萨顿还给现场观众提出了一个问题:在一个由智能体构成的社会里,类似人类社会,所有个体的目标应该是唯一的还是多元的?
萨顿认为:“在强化学习中,每个智能体都有自己明确的目标,也有自己的奖励。同样,在自然界中,每只动物都有它自己的痛苦和快乐。回看我们的经济,只有当每个人有不同的目标和能力,经济才能运行得最好,经济并不真正依赖于人们拥有共同目标。”“不同的智能体可以和平共处,即便它们的目标不同,我们并不需要所有人都对齐同一个目标。”
萨顿说:“人类最卓越的超能力就在于我们比其他任何动物都更擅长协作。放眼当下,有很多呼声希望对人工智能进行中心化控制:对齐AI的目标,暂停甚至终止AI研究,限制可投入的算力,限制AI行业的竞争程度,借此来确保 AI 的安全。而这些主张如出一辙,根源都是恐惧”
最后,萨顿谈到了人工智能与哲学的议题。他认为:“人工智能是人类最古老的追求之一,它并不是陌生的外来技术,与人类的本性高度相似。智能是宇宙中最伟大的力量之一,如果能理解它,人类就会变得更强大、更有能力。”
在最后,萨顿总结道:“我相信,我们正在进入一个全新的经验时代,潜力将远超以往。人工智能是宇宙演化的必然,我们应以勇气、自豪和冒险精神来迎接它。”
运营编辑|李阳

