
Google DeepMind 的最新研究揭示,人工智能正以指数级的速度,推动数学研究的边界。
一项新成果表明,一个由大语言模型驱动的编码智能体,能够帮助人类发现全新的数学结构,进而突破我们对复杂性理论的认知。
这个智能体将验证速度提升了大约 10,000 倍,它所用的方法是分支定界法,这是一种经典的优化问题求解策略。并且,所有结论都经过了最终的暴力穷举检查,确保了结果的绝对可靠。
AlphaEvolve:从局部突破到全局提升
这项工作的核心是一个名为 AlphaEvolve 的系统。它通过代码来搜索证明中的关键组件,这些组件是计算机能够完全理解和验证的。
它的策略是聚焦于证明内部的那些微小对象。只要能对这些小对象进行优化,整个证明的逻辑强度就能得到增强。
这种方法被形象地称为提升,因为它意味着一个局部的、微小的改进,最终能带来一个全局性的、普适的成果。

AlphaEvolve 的工作流程是:它利用多个代码片段生成候选对象,然后测试并保留好的部分,再通过演化算法不断迭代出更好的版本。
这个循环会一直持续,直到找到能通过全部严格检查的完美对象。通过这种方式,它巧妙地将“搜索”和“验证”两个环节融为了一体。
应用案例:攻克 MAX-4-CUT 难题
研究中的一个关键案例是 MAX-4-CUT
问题。简单来说,就是想办法将一个图切分成 4 个部分,并让被切断的边尽可能多。

之前的结论是,想找到一个近似度优于 0.9883 的算法是 NP 困难的,这意味着它在计算上几乎不可能实现。
但 AlphaEvolve 发现了一个全新的构件,它包含 19 个变量和一套极其复杂的权重体系,其中一些权重甚至是其他权重的 1429 倍。
在这里,提升的理念展现得淋漓尽致。你可以把一个数学证明想象成一条长长的字符串。
AlphaEvolve
只需从这个字符串中截取一小段进行修改和优化,同时完全不改变它和其它部分的连接关系。
这个被截取的小段,就是一个有限的结构,比如一个构件或一张小图。当这个优化后的小段被重新嵌入证明中,整个定理的强度就获得了质的飞跃。
最关键的是,我们不再需要重新验证整个冗长的证明,而只需检查那个被演化过的小小组件就足够了。
MAX-4-CUT 问题的新里程碑
回顾一下,MAX-4-CUT
的目标就是将一张图分成四块,让跨区域连接的边最多。
过去我们知道,除非 P=NP,否则算法的近似率无法突破 0.9883。而 AlphaEvolve 通过发现那个包含 19 个变量的复杂新构件,将这个难度界限推进到了 0.987。
这个数字的变化看似微小,但在这一前沿研究领域,小数点后第三位的推进,都堪称里程碑式的重大进展。那个被发现的构件,正是证明这一新极限的核心。
新方向:平均情况复杂性与拉马努金图
AlphaEvolve 的探索并未止步于此。它还将目光投向了“平均情况复杂性”,即不再只盯着最难的极端情况,而是研究典型随机图的求解难度。

研究焦点是稀疏随机图中的 MAX-2-CUT 和最大独立集问题。理论上,一种被称为拉马努金图的特殊图,可以作为问题难度的有力证据。
在过去,计算机搜索最多只能找到包含约 10 个节点的这类图。但 AlphaEvolve 成功将这个数字提升到了 163 个节点。
这一发现意义重大。因为它找到了尺寸远超以往的证据,从而大大增强了相关问题的难度证明,使得为随机图的 MAX-2-CUT 问题进行确定性认证变得更加困难。
参考资料:https://research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!