闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
Gemini又偷偷藏不住了。
内部数学版学霸模型FullProof全程不联网,直接帮数学家证明了代数几何领域的一个新定理——
0亏格映射到旗簇空间的motivic类等价结论。
好好好,咱先来简单理解一下,就是把一堆无缺口的橡皮筋按一定的规则套进层层嵌套的盒子里,橡皮筋所有的摆放方式就对应了一个空间;
新结论证明这个空间可以用「一般线性群+仿射空间」的组合来表示,后续研究相关问题直接分析这个简单的样板就行。

在这项研究中,Gemini埋下关键思路的伏笔,甚至能独立给出反例,精彩表现直接让美国数学学会主席都点赞:
Gemini的证明严谨、正确、优雅……这是我本人也会引以为傲的见解。

那咱就来看看怎么严谨、怎么优雅的??
Gemini埋下关键思路伏笔
这篇论文聚焦的核心问题,是确定0亏格映射到旗簇空间的motivic类等价形式。
- 旗簇空间
是一种由不同维度子空间层层嵌套构成的几何结构,类似大盒套中盒套小盒的收纳系统; - 0亏格映射
对应把无洞的光滑曲线(像橡皮筋)放进这个嵌套空间的所有摆放方式; - 格罗滕迪克群
代数几何里一个用来给几何空间分类归档的数学工具,专门解决“复杂空间能不能等价成简单空间”的问题; - motivic类
就是代数几何里,给各类几何空间在格罗滕迪克群里贴的身份标签。
数学家想要知道的是,这些复杂的摆放方式集合,能否在格罗滕迪克群里,找到一个结构简单且和这个集合性质完全等价的替身。
数学家采用分次纤维化迭代的思路推进证明,这个关键思路正是Gemini在推导过程中暗示的。

研究人员先搭建旗簇空间的部分旗塔结构,定义对应的投影映射,把原本复杂的映射问题拆解成一层一层的纤维求解问题,证明每一层的纤维都和带基点的无处零截面空间是同构的;
接着计算这类截面空间在格罗滕迪克群里的等价类,再基于motivic平凡纤维化的性质,得出结论,这个等价类的表达式只和向量丛的秩与次数有关,和向量丛的具体分裂类型没有关系。
最终证明,当代表空间层级特征的数值β满足“严格单调”条件时,
这个复杂集合的motivic类,恰好等价于“一般线性
群
”与“仿射空间
”的组合。

这就为后续研究提供了极简的分析模板,也搭建起代数双重环空间与拓扑双重环空间之间的联系桥梁。
接下来说说Gemini的功劳。
研究初期,数学家先提出了一个关于有限域点计数的弱猜想,还将这个核心难题拆解成从易到难的阶梯式子问题,比如先让AI解决
这类具体案例。
基于Gemini打造的专用数学系统FullProof,迅速给出了这些特殊案例的完整证明。
推导过程围绕多项式三元组的互素性、相交对条件展开,结合莫比乌斯反演、zeta函数等工具完成计数,逻辑非常严谨。
还隐含了纤维类独立性的关键思路,比如证明中指出
的选择数量与
的分裂类型无关,这也就是关键思路的伏笔。
△FullProof输出的多项式三元组推导手稿
当数学家提出“该结论能否推广到同伦等价场景”的疑问时,FullProof独立给出了有效的反例。
比如论文中提到的
的情形,证明
不具备
的有理同伦型,明确了定理不能直接拓展到同伦等价的范畴。

专用数学学霸
这次用到的Gemini数学版(内部叫FullProof),特别擅长攻克motivic类这种高阶抽象计算难题。
它的工作方式是先从最小的特殊情况入手,先搭逻辑链,再推结论,在数学推理上比普通AI严谨得多。
重点来了,完成这些推导全程不用联网,完全靠模型自己训练时攒下的数学知识,现场脑补出全新的证明思路。
作者们特意对比了现有文献,发现FullProof的输出跟已发表的东西没有明显重合,基本确定原创。

对比之前数学家们用过的Macaulay2工具,Gemini明显更厉害也更快。
以前Macaulay2只能做数值验证,而Gemini能给出可直接复用的逻辑框架,大幅缩短了研究周期。
但是话说回来,Gemini目前还没法独立做到从特殊案例推广到通用结论这一步。
客观上要依赖数学家搭建框架、提炼策略。
不过还是想知道,Gemini藏的这个数学学霸啥时候公开呢~

论文地址:https://arxiv.org/pdf/2601.07222
参考链接:https://x.com/A_G_I_Joe/status/2011213692617285729