诺奖得主联手Claude,40轮对话证出12年物理猜想

新智元 2026-06-07 18:00

诺奖得主联手Claude,40轮对话证出12年物理猜想图1

  新智元报道  

诺奖得主联手Claude,40轮对话证出12年物理猜想图2

【新智元导读】一道悬了12年没人证出来的物理猜想,诺贝尔物理学奖得主Giorgio Parisi把它交给了Claude,模型几乎自己推出了完整证明。

一篇诺奖得主的论文中,特意点名了Claude。

就在几天前,一篇理论物理论文挂上了arXiv,作者在论文中提到了Claude的Sonnet 4.6和Opus 4.7,说这个证明「基本上是Claude自己推出来的」。

诺奖得主联手Claude,40轮对话证出12年物理猜想图3

https://arxiv.org/pdf/2606.03300

论文作者是Giorgio Parisi,2021年诺贝尔物理学奖得主。

诺奖得主联手Claude,40轮对话证出12年物理猜想图4

诺奖委员会官方解释他的获奖理由时,说他「发现了从原子到行星尺度的物理系统中,无序与涨落之间的相互作用」。

诺奖得主联手Claude,40轮对话证出12年物理猜想图5

通俗地说,Parisi的大部分时间都在干一件事:

在看上去毫无规律的随机系统里,把背后藏着的隐秩序找出来,并且证明小到一块磁性材料、大到地球气候,都遵循同一套规律。


这次他与合作者Francesco Zamponi要攻克的是阻塞(jamming)转变理论里一道悬了12年的硬骨头:一个叫a+b=1的等式。

数值上,它早就被验证到极高精度。可整整12年,没人能证明它为什么对。

更巧的是,这个等式恰恰建立在Parisi自己开创的理论里。

全复本对称破缺(full-RSB),是Parisi在自旋玻璃和复杂无序系统研究中发展出的核心框架之一,也属于他后来获得诺奖所表彰的复杂系统理论贡献的重要组成部分。

这一次,它被证出来了,主力就是Claude的Opus 4.7。

40轮对话的人机交互中,Claude回到了Parisi当年的理论框架,补上了那块理论证明的缺角。

这事传开后,Stability AI创始人Emad Mostaque转发了论文:「如果Claude连诺贝尔奖得主都用得上,那对你来说也足够好了。」

诺奖得主联手Claude,40轮对话证出12年物理猜想图6

Parisi和Zamponi两人干脆把他们与Claude的对话在网上公开了:Claude到底在哪一步帮了忙,哪一步又是人改的,任何人都逐段去翻。


诺奖得主联手Claude,40轮对话证出12年物理猜想图7

https://zenodo.org/records/20478428

那么问题来了。


这道把诺奖得主卡了12年的题,到底难在哪?


在问题的解决过程中,Claude又是怎么一步步从打杂,变成承担证明任务的主攻的?



诺奖得主联手Claude,40轮对话证出12年物理猜想图8
一个等式
让物理界等了12年

要掂量这件事的分量,得先知道a+b=1到底有多难搞。

2014年,包括Parisi、Zamponi在内的几位物理学家,发表了关于无穷维硬球阻塞理论的系列论文(学界简称CKPUZ)。他们在计算里发现,几个临界指数之间,似乎藏着一个干净利落的关系:a+b=1。

数值上,这个等式严丝合缝,但他们试了又试,就是给不出一个解析证明。论文里只能写道:观察到它成立,证不出来。

这一等,就是12年。

更要命的是,这个等式还把两套理论连在了一起:一边是fullRSB解里的「相空间边缘稳定性」,另一边是堆积体系里的「力学边缘稳定性」。

证明a+b=1,就等于证明这两种「边缘稳定」在无穷维理论里其实是同一回事。

能算到小数点后好几位都分毫不差,却没人能说清它为什么对,这个等式成了理论物理中的一桩悬案。


从Parisi那份公开的对话中,为我们复现了Claude是如何与他紧密配合,破解这桩悬案的。



诺奖得主联手Claude,40轮对话证出12年物理猜想图9
从打杂到主攻
Claude主要干了什么

双方的配合,一开始并不是直接奔着证明去的,而是从数值求解开始。

Parisi第一条提示词,是让Claude写一段C++ 代码,用打靶法(shooting method)求解一个非线性微分方程,精度希望达到 (10^{-10})。

这是一个程序员的体力活:把方程算出来,验证到足够高的精度。

诺奖得主联手Claude,40轮对话证出12年物理猜想图10

Parisi要Claude写一段C++代码,用打靶法(shooting method)求解一个非线性微分方程,此时Claude还只是个程序员,干的是把方程算出来的体力活。

接下来很长一段,Claude都在干这种活:调代码、提精度,从普通双精度一路加到四精度,把数值结果一点点逼到小数点后十几位。

中途Parisi还把方程写错了一次,把其中一个函数写串了。Claude在这个错方程上反复尝试,甚至正确地指出它本身就无解,直到Parisi回过头才发现,是自己写串了函数。

真正的转折,出现在Parisi那句话之后:「我自己接下来能搞定了。你应该注意到a+b≈1精度极高。有人猜想这个关系是精确成立的。我要你做一个解析计算,证明它。」

诺奖得主联手Claude,40轮对话证出12年物理猜想图11

人类把那个精度极高却始终没人证出的关系:a+c/2=1/2(即a+b=1),正式交给Claude,要它给出解析证明。

从这一刻起,Claude的角色变了。

它给出的证明,核心是构造了一个特殊的辅助函数,再经过两处并不显然的代数消去,得出一个关键恒等式。把这个恒等式和已知的物理条件一拼,结论就出来了:a=(1-c)/2,也就是a+b=1。

有意思的是,后来Parisi直接问Claude:你是怎么想到这个证明的?

Claude回答道:这里没有什么灵光一现,那个关键的辅助函数,其实是从想要的结论反推出来的,是「一套相当系统的逆向推理,加上小心的计算」。

它还补了一句:「不浪漫的版本,往往更接近真相。」

诺奖得主联手Claude,40轮对话证出12年物理猜想图12

Claude复盘自己是怎么想到证明的:先由数值结果锁定目标a+c/2=1/2,再反推出关键的测试函数ξ=fg,剩下的全是代数硬算。

在合作的后半部分,Claude所做的并非在已知套路里填空,它参与的是数学结构本身的搜索和构造。



诺奖得主联手Claude,40轮对话证出12年物理猜想图13
别急
人类科学家并没有出局

人类科学家并没有出局。

在Parisi公开的这份对话里,Claude的证明初稿一出来,人类并没有照单全收,而是指出了其中的错误,把方向重新拨了回来。

Claude的证明里有一步,要论证函数f恒不为负。它信心十足地用了一个极值原理的论证。

结果合作者Zamponi直接指出:这个论证是错的,在极小值处根本不存在矛盾。Claude也没犟,当场认错:「你的朋友是对的……我犯了一个符号错误。」

随后它一步步复盘,承认上界论证成立、下界论证确实失败。

诺奖得主联手Claude,40轮对话证出12年物理猜想图14

合作者Zamponi(对话中署名FZ)直接指出Claude某步论证有误,Claude先承认「你的朋友是对的」。

认错之后,Claude逐步复盘自己错在哪:在极小值处,方程给出的结果其实与极小值条件相符,构不成它原以为的矛盾。

它承认「我犯了一个符号错误」,并标明上界论证成立(✓)、下界论证失败(✗)。这一步的漏洞,是人类发现的。

诺奖得主联手Claude,40轮对话证出12年物理猜想图15

人机之间的纠错是双向的。

在另一处,是合作者算的一个渐近行为里带了个小错,反过来被Claude挑了出来,还顺手定位到出错的根源。

这更像两个同行在一块儿磨一个证明,而并非谁服务谁。

但真正决定性的,是人类重新定义了整个问题。

Parisi提醒Claude:你根本证不出那个函数永远非负:因为这个方程的解不止一个,大多数解都会上下摆动、反复穿过零线,而你先前用打靶法挑中的,只是其中唯一不摆动、始终待在零线上方的那一个。所以问题从一开始就问偏了:不该问「它一定非负」,而该问「到底有没有一个始终非负的解」。

紧接着,Parisi给出了破局的思路:别死磕那个极限方程,回到更上游的原始方程,重新定义一个随尺度演化的函数,只要证明这个演化过程不破坏非负性、初始条件又非负,就赢了。

Claude照着这条路走下去,把它落成了一个标准的反应扩散方程,再用成熟的极值原理,最终补完了证明。

诺奖得主联手Claude,40轮对话证出12年物理猜想图16

人类给出破局思路:回到上游方程,定义随尺度演化的函数,只要证明演化不破坏非负性、初始条件又非负即可。设问题、指方向的是人,推导演算的是AI。

换句话说,模型能推、能算、能写代码,也能认错。但发现错误、推翻错误、重新设定问题、指出正确方向的,自始至终是人。

整个过程中,真正的分工是这样的:AI负责推、负责算,人类负责设问题、挑错、核验和拍板。

模型能推出一个证明,但判断它对不对、值不值得留下,依然是人类的工作。



诺奖得主联手Claude,40轮对话证出12年物理猜想图17
留下的
不只是一个证明

这个故事最有意思的地方,不在于证明本身,而在于它把整个过程都公开了:哪一步是Claude推的,哪一步是人改的,哪一步推倒重来,全都看得见。

这在科研里是个新做法。

过去一篇论文写「我们借助了某工具」,外人无从查证。这一次,AI到底贡献了什么,被做成了任何人都能下载、逐段核对的证据。

大模型的角色正在改变,从写代码、查文献、做摘要的外围,转向参与复杂数学结构推导的核心。

而人类的位置也在转变,转向设定问题、筛选方向、最后把关拍板的角色。

参考资料:

https://x.com/EMostaque/status/2063000615383421400?s=20%20

https://arxiv.org/pdf/2606.03300%20

https://zenodo.org/records/20478428


编辑:元宇


秒追ASI
点赞、转发、在看一键三连
点亮星标,锁定新智元极速推送!

诺奖得主联手Claude,40轮对话证出12年物理猜想图18

诺奖得主联手Claude,40轮对话证出12年物理猜想图19

诺奖得主联手Claude,40轮对话证出12年物理猜想图20

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
比亚迪3月销量超30万辆 海外市场与闪充技术双轮驱动增长
三星Q1运营利润创历史新高 AI驱动存储芯片价格飙升
2026年中国智能驾驶域控制器‌市场政策、发展现状及未来发展趋势分析:爆发增长迈向千亿市场,融合自主驱动产业进阶[图]
从“具身本能”到“具身智能”:橡木果发布“本能驱动”技术路线,开辟自下而上新范式
谷歌地图推Gemini驱动“Ask Maps”与沉浸式导航新体验
【半导体设备】AI&存储双驱动:全球ATE设备竞争格局与创新对垒
国产存储突围迫在眉睫,AI驱动涨价潮倒逼产业链自主化
联想控股2025年营收破六千亿,AI与硬科技双轮驱动创历史新高
Omdia:2025年第四季度,中国大陆云基础设施支出增长26%,AI与智能体成主要驱动力,阿里云继续保持领先地位
3D打印“狂飙”背后:兆易创新GD32 MCU多元方案驱动性能升级
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号