数学家取得突破时,他们也会产生幻觉。
但与 AI 不同,它们超越了既有的研究成果。它们已经学会了区分有希望的幻觉和死胡同。
数论学家肯·奥诺谈 AI、创造力和数学发现。
为什么预测问题难度如此困难
Daria
您能简单介绍一下自己吗?您来自哪个领域,目前在哪里工作?
Ken
我叫肯·奥诺。我从事数论研究,并在弗吉尼亚大学任教。
Daria
对于一个 AI 来说,是什么让一个问题变得困难?
Ken
预测哪些问题是难题,本身就是一件非常困难的事。
今天早些时候,我们项目的负责人埃利奥特进行了一项小调查,看大家是否能预测出哪些问题一直难以解决。
结果表明,我们并不擅长这个。
数学家和 AI 如何都会幻觉
Ken
那么,AI 在哪些方面会遇到困难呢?其实,AI 难以处理的那些特性并不令人意外,主要就是创造性的部分。
这其中包含了信念的飞跃,人们常称之为幻觉来嘲笑 AI。
但请别搞错了,作为纯粹数学家,当我们处于最佳状态,做出超越现有文献的发现时,我们其实也在经历幻觉。而且,我们偶尔会是对的。
我们对 AI 的能力了解多少了呢?我现在是这样看的:我觉得自己已经提不出一个 AI 无法识别其所属数学领域的问题了。
因为 ChatGPT 这类模型似乎已将人类积累的全部知识尽在掌握。这种情况发展得如此之快,持续让我感到惊讶。
三年前,这些大语言模型连五岁小孩都能做对的事情都会搞错。而现在,我们向它们提出的问题,可能连我们大学里的博士生都不知道该从何查起。
AI 作为数学发现的副驾
Daria
展望未来,您预计在比如三年内,AI 在数学领域会达到一个什么样的位置?
Ken
我的回答可能有点有趣。我们正在参加这个前沿数学研讨会,目标是建立一个包含 50 个高难度数学问题的基准。
主办方建议,我们应该把大语言模型看作一个对手,去设计一些极其刁钻的难题来对抗和测试它们的能力。
但你知道吗,仅仅过了五六个小时,我就发现参与者们的想法已经变了。
当他们试用了提供给我们的 ChatGPT 专业版后,你可以看到他们眼中放光,心想:这太神奇了,它真的可以成为我得力的副驾。
所以,我认为未来会怎样?今年夏天晚些时候,我们可能会讨论 AI 在这些难题上的表现,这会是件大事。
但或许更重大的事情是,当所有与会的数学家回到各自的大学后,大家会普遍认识到,AI 真正的定位就应该是一个副驾。
它会帮助我们的科学发现吗?绝对会。
就像大语言模型能在国际象棋中发现新开局,在围棋中找到新策略一样,想象一下当这种力量被用于解决数学问题时,将会带来多大的可能性。
AI 如何帮助揭示新的素数公式
Daria
您在自己的研究中使用 AI 吗?
Ken
我确实在研究中使用 AI,而且用法还挺多。
有些用法比较常规,AI 就像我的助手。比如,ChatGPT 能帮我补上文献阅读的缺口。
尽管我读了很多论文,也自认为了解前沿,但新论文层出不穷,AI 正好能帮我查漏补缺。
但现在,我越来越多地把 AI 当作一个发现工具。用它来寻找那些我可能完全没有意识到的新现象,而这样的事情一直在发生。
去年我写了一篇论文,在一个叫做整数分拆理论的数学领域,我们发现并证明了无穷多个能够探测素数的表达式。
它们不是判断某个数是不是素数,而是能真正地按顺序罗列出所有素数,并且根本不需要进行因数分解。
几年前,我还会认为这是不可能的。而这些公式的最初线索,正是计算机告诉我的:我认为这里存在一种探测素数的模式。我记得当时我完全被震惊了。
这个关于素数的定理之所以重要,很大程度上源于历史。有一个著名的问题叫作希尔伯特第十问题。
1900 年,希尔伯特为未来的数学家们列出了一份清单,其中包含了二十多个他认为重要的数学问题。
其中一些问题至今悬而未决,比如黎曼猜想。但第十个问题,表面看似乎平平无奇。
它本质上是问:是否存在一个神谕,当你给它一个丢番图方程时,它能简单地回答“是”或“否”——“是”,存在整数解;或“否”,不存在。
它不需要帮你找出解,只要告诉你有没有就行。到了 20 世纪 70 年代,逻辑学家们著名地证明了:不,不存在这样的神谕。
这个结果主要基于尤里·马季亚谢维奇的工作,它表明,没有任何计算机算法能够百分之百判断一个给定的丢番图方程是否有解。
这或许令人失望,但它恰恰肯定了数学的深邃,揭示了数字世界的内在复杂性。
在此过程中,马季亚谢维奇工作的一个推论是:必然存在一个多项式,当你把正整数代入它的变量时,其产生的正数值恰好就是全部的素数。
后来,人们确实找到了这样一个多项式。但它实在太复杂了,有 20 多个变量,次数也是 20 多次。想靠它代入数值来找到素数 37,简直是天方夜谭。
我刚才描述的研究工作,就和这个思路非常相似。只不过,我们用的是来自整数分拆的函数来代替多项式。
与那个复杂的多项式不同,我们的函数能快速地、按顺序地生成素数。当然,请放心,速度还没快到威胁互联网安全的程度。
但作为一个理论工具,计算机帮助我们发现了一个我们曾认为根本不存在的数学领域。所以,它是一个好伙伴。
一个好的伙伴,就应该能给你提供猜想的线索,然后你可以去证明它,或者以此为基础,构建起一整个理论体系。
证明黎曼猜想的梦想
Daria
既然您提到了黎曼猜想,如果让您猜一下,它最终会由谁解决?是人类,是 AI 辅助的人类,还是 AI 自己?
Ken
我希望能在有生之年看到黎曼猜想被证明。我花了大量时间思考它。
我对未来的梦想是,AI 或许能帮助我们找到一种模式。这种模式就算不能直接证明黎曼猜想,也能证明一些足够接近它的结论。
这样一来,所有基于黎曼猜想成立的推论和结论就都能被确立了。
你可能知道,现在有成百上千的数学定理都是有条件的,它们都建立在“如果黎曼猜想为真”这个前提之上。
但一个不那么为人所知的事实是,黎曼猜想本身像一把大锤,威力过猛了。很多由它引出的结论,其实并不需要完整的黎曼猜想就能证明。
所以我的梦想是,那些难度稍低、但依然悬而未决的重要问题,能够因为 AI 揭示的新模式而得到解决。这能实现吗?我不知道,但未来可期。
对 AI 在学术界的担忧与护栏
Daria
对于 AI 的未来,您有什么担忧吗?
Ken
有。请让我非常谨慎地回答这个问题。
有一部著名的电影叫《终结者3:机器的崛起》,它讲述了 AI 的到来和可能的人类末日。
如今,AI 已经无处不在。像我这样在大学工作的人,更能感受到它的冲击。AI 的出现,已经开始主导我在弗吉尼亚大学的非研究性工作。
我是学校的 STEM 顾问,在过去两年半里,我们一直在进行高层级的讨论,核心就是如何为大学的未来做好准备。我们希望十年后,大学会因 AI 而变成什么样。
所以,我确实深切担忧 AI 将对大学产生的正面和负面的双重影响。
同时,我作为美国国家安全局顾问委员会的成员,我们真的非常担心 AI 的未来,无论是虚假信息问题,还是关键基础设施失控的风险。我认为这些担忧都是有道理的。
回到我们今天的“前沿数学”研讨会。我们不只是在向这些 AI 系统提问,我们更是在研究它们的回答和思考过程。
你可以把同一个问题问 AI 五遍,可能会得到五份完全不同的回答。
五年前,我肯定会告诉你,计算机就是执行程序,输入相同,输出必然相同。但现在,情况完全变了。
当你意识到这一点,并且不知道背后的原因时,我们就应该感到警惕和担忧。
教育必须如何适应 AI
Daria
您认为,我们整个社会是否对 AI 即将带来的冲击给予了足够的关注?
Ken
我是一个乐观主义者。我的看法是这样的:
当初个人电脑出现时,很多人觉得许多行业要完蛋了。但恰恰相反,那些行业被重塑了,并且在几年内,生产力变得比我们想象的要高得多。
生产力会提升吗?会的。某些职业会消失吗?哦,那也绝对会。我们所有人都应该做的,就是清醒地认识到这一点,并为此做好准备。
对我们教育工作者而言,我们必须重新思考我们布置的练习题的价值,重新审视我们分配给学生的研究项目的真正目的。
因为我们正逐渐认识到,这些工作中的很大一部分,都可以被轻易地自动化。
我们现在必须思考,那些通过完成特定任务所培养的技能,到底有多重要。
所以我认为,我们教育领域的许多人,都将被迫去深刻反思我们教什么、为什么教,并为未来做出适应与规划。
这件事已经在发生了。本月早些时候,美国国家科学院组建了首届数学科学教育委员会,我和在座的拉维·瓦基尔都是成员。
我们将深入思考,从幼儿园到博士后的整个教育体系,在科学领域应该是什么样子。
Daria
现在,我想问几个快问快答。您预计今天这个数学难题基准,能抵挡 AI 多久?
Ken
我仍然认为,里面大部分难题对目前的 AI 来说还是太难了,所以结论还为时过早。
至于我们正在设计的这批新问题,我希望 AI 的得分能在很长一段时间内都是零。但到 2030 年还会是零吗?我对此深表怀疑。
Daria
在 0 到 10 的范围里,您预计 AI 将在多大程度上重塑数学研究?0 代表袖珍计算器的水平,10 代表数学家这个职业被淘汰。
Ken
我认为数学家永远不会被淘汰,因为 AI 不知道如何提出好问题。
如果 AI 真的能提出好问题了,那将是一个真正意义深远的时刻。
我知道 ChatGPT 这类工具会根据对话提供一些自然的后续问题,但我说的不是这个。
提出能够推动一个理论向前发展的好问题,需要极高的技巧。我认为我们永远需要具备这种能力的人,而这样的人才一直都很稀有。
所以在这个范围里,我给 7 分。我认为 AI 将会非常重要,也许是 8 分。
什么造就一个伟大的数学问题
Daria
稍微偏个题。一个人如何学会提出好问题?这可以学吗?
Ken
这通常源于谦逊。你得先承认,我不知道什么。
然后你会想,这些是我渴望解决的终极问题,但我现在一个也解决不了。
那么,作为前进的策略,我能提出什么样的小问题,能为那个更深层次的目标提供一丝光亮呢?
一个登月级的难题,很少能因为你恰好问对了问题就直接解决。这种情况极为罕见。
通常,在二三十年的时间里,你可能需要沿途提出 30 个甚至更多的中间问题来逐步推进。
在这次对话中,我特意用了幻觉这个词。我们总爱说 AI 会产生幻觉,好像这是件很糟糕的事。
但我研究 AI 解决数学难题的记录时,反而觉得这是件好事。
AI 的解题过程通常是这样的:前几页内容会让你惊叹,天啊,它竟然知道这个、那个,甚至还会发现错误,返回去重新计算。感觉就像在和一个研究生交流。
但再往后翻几页,你可能会看到几行中文,过一会儿又冒出几句法语,中间还夹杂着数学公式。它在庞大的文献库里搜索它曾见过的模式。
你知道吗,这其实就是我们人类做研究时的真实写照。
我们常常在不确定性中挣扎,大部分时间都感到困惑。但就在某个时刻,你也会产生一次幻觉,心想:我猜想某某事情会不会是真的?
十次里有九次,这可能只是个愚蠢的想法。但即便如此,你也会学到东西,因为你明白了这条路走不通,以后就不用再试了。
而总有那么一次,你会碰到一个无法轻易排除其相关性的问题,那或许就是通往答案的钥匙。
所以,幻觉是好事。但同样重要的是,你要有能力识别出哪些幻觉是纯粹的错误。AI 在这方面还不够好。
同时,你也要能识别出那些“无法排除的可能性”,并告诉自己:也许,我需要更深入地探索一下。
通过故意犯错来教学
Daria
您在教学中会有意犯错吗?
Ken
你问的很有趣。有时候,会的。
在弗吉尼亚大学,我教一门证明入门课。我从第一天就告诉学生,课程中会有一节课,我会故意讲一堆错误的东西。
他们的作业,就是揪出我的所有错误,并把它们全部修正过来。这个过程超级有趣。
举个简单的例子,比如等比级数求和,,我们知道它收敛到 2。
我可以给出一个看似正确却错误的证明。然后,我会用完全相同的逻辑,去证明所有正整数的和等于一个有限数。
当然,正整数的和是无穷大。通过这个例子,我就可以告诉他们,为什么在处理无穷过程时必须格外小心。
所以,回答你的问题,我会有意说一些错误的东西吗?绝对会。
为高等教育的未来做好准备
Daria
您对现在的数学学生有什么建议吗?我们应该如何使用 AI?
Ken
我在学校教务长办公室的部分工作,就是思考如何为高等教育的未来做好准备。
AI 刚出现时,我们最担心的是如何确保学生独立完成作业。两三年前,我们还在讨论怎么防止学生用 Chegg 这样的网站。
现在没人谈 Chegg 了,因为大语言模型更强大。我们最初非常关心学生如何学习写作,但现在我们已经适应了。
只要给出正确的引导,你完全可以用 AI 工具来帮助学生更好地学习写作。
如何写数学证明?AI 助手可以帮我们快速地对一个证明进行剖析。
如何批判性地思考?当你费尽周折写出一个证明,但它很蹩脚时,AI 可以帮你把它打磨得更简洁、更优雅。这是一种更高层次的编辑。
是的,我相信 AI 能在这些方面帮助我们。虽然现在大家谈论得还不多,但我预见这在未来会变得至关重要。
AI 会像工业革命一样重塑世界吗?
Daria
谢谢您。在 0 到 10 的范围里,AI 会在多大程度上重塑世界?0 代表袖珍计算器,10 代表工业革命。
Ken
10。我 57 岁了,亲眼见证了技术进步对我们生活的影响。
从电动打字机,到文字处理器,再到我上大学时拥有自己的苹果电脑,直到今天的智能手机。
所以,我选 10。
Daria
您对 AI 进展的态度如何?0 代表如果可以,就完全停止 AI;10 代表不计一切代价加速发展。
Ken
我不认为我们应该在没有建立有效护栏的情况下全速发展 AI。
我希望我是错的,但毫无顾忌地全速前进是天真的。当今科技有太多可能导致虚假信息和风险的地方。
所以,绝对不是 10,但也肯定不是 1。
我们今天拍摄所在的这家公司叫 Constellation,他们的使命就是支持所有能使 AI 更安全的倡议。
只要有这样的机构存在,并且它们的专业意见能在政策制定中得到充分的重视,而不是被当成摆设,那么,我的态度也许是 7。
创造力、神经网络与人类心智
Ken
当我们在做研究时,无论是数学还是其他科学,我们都会沉浸在问题中数月甚至数年。
就在某个不经意的时刻,灵感会突然涌现,而我们并不知道它从何而来。
最近,我戴上一副新的眼镜——也就是从 AI 身上获得的启发——去重新审视我过去那些所谓的灵感时刻。
我在想,当时的我,是否只是在生物学层面上,做着和神经网络一样的事情?
当我大脑中的神经连接达到了某个阈值,那个发现就自然而然地发生了。
现在看来,我过去的许多发现,可能都属于这一类。
这并不是什么负面的事,因为能够建立这些联系本身,就是我所理解的创造力。只不过,这是一种与我原以为的不同的创造力。
这样想,一方面确实令人感到谦卑,但另一方面,也让人感到一种解放。
因为它告诉你,只要你保持真正的好奇心,并且持续不断地学习,你就可以期待那样的阈值时刻降临到自己身上。
现在,当我在一个问题上卡壳数月而没有进展时,我依然能抱有信念。
因为我知道,我仍在进步,只是还没有达到那个让一切豁然开朗的阈值而已。从这个角度看,这确实是一种解放。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!