在阿塞拜疆巴库举行的第 49 届 ICPC 全球总决赛上,两支科技巨头的 AI 团队双双超越人类极限:OpenAI 以 12/12 的完美战绩夺冠,Google 也以 10/12 斩获金牌,最好的人类队伍解出了 11 题。
这一结果标志着 AI 在复杂的逻辑推理和问题解决领域,达到了一个全新的高度。
背景介绍:算法竞赛的奥林匹克
国际大学生程序设计竞赛(ICPC)被誉为“算法竞赛的奥林匹克”,是全球范围内历史最悠久、规模最大、最具声望的大学生程序设计竞赛。其核心特点是:
团队作战:三名大学生组成一队。
资源有限:在五个小时的比赛时间内,团队只能使用一台电脑。
极限挑战:解决 10 到 13 个极其复杂的算法问题,题目通常源于现实世界的难题,涉及高级数学、数据结构和创新算法。
通用 AI 的终极考验
与以往不同,今年的赛场迎来了两位特殊的参赛者,它们均在与人类选手完全相同的规则下进行比赛。
Google 团队:他们使用了Gemini 2.5 Deep Think 的高级版本作为解题核心。 OpenAI 团队:他们采用了通用推理模型的集成系统,该系统并未针对 ICPC 进行任何专门训练。它由两部分组成: GPT-5:作为主要的解题模型。 一个未发布的实验性推理模型:负责生成最难题目的解决方案,并最终筛选、决定提交哪个模型生成的答案。

最难题 G "Lava Moat"
今年的题目集被普遍认为难度极高。根据知名投资人 Menlo Ventures 的 Deedy 在 X 上的分析,其中最难的 G 题 "Lava Moat" 成为了关键:
OpenAI 的系统为了解决这道题,前后共尝试提交了 9 次。 这道题是 Google DeepMind 未能解决的两道题之一。 解出此题速度最快的人类队伍,也花费了整整 270 分钟(总时长为 300 分钟)。

AI 的压倒性胜利
OpenAI (12/12,世界第一,金牌):
以完美战绩超越了成绩最好的、解出 11 题的人类队伍。 其对外公开的 GPT-5 模型独立解决了 11 道题,这个成绩本身就已经超越了 Google 的模型。 最后也是最难的一道题,由其内部的实验性推理模型独立生成答案并成功通过。 Google (10/12,金牌):
同样取得了金牌的优异成绩。 值得注意的是,Google 的 AI 解决了一道没有任何人类队伍能够解决的难题,展现了其强大的创新解题能力。
各阵营大佬X上庆祝
赛后,双方团队的核心成员和业界人士纷纷在 X 上发表观点,揭示了这一成就背后的深远意义。
来自 OpenAI 阵营的观点:
OpenAI 的研究员 Jakub Pachocki 将此次胜利视为一个系列成就的顶点:

OpenAI 的另一位核心成员 Mark Chen 简洁地总结道:

一位参与该项目的 OpenAI 成员补充道:
““很高兴能参与这个不可思议的旅程,展示了我们的 AI 推理系统成功解决了 ICPC 总决赛的全部 12 道题……这一成就凸显了我们正在取得的飞速进步,我乐观地期待,未来通用 AI 系统将能常态化地带来全新的科学洞见,并积极拓展人类知识的边界。”
来自 Google 阵营的观点:
Google 官方在声明中,将其 AI 的表现定义为通往 AGI(通用人工智能)道路上的重要一步:
““在(IMO 和 ICPC)上解决复杂任务需要深度抽象推理、创造力、为前所未见的问题综合出新颖解决方案的能力,以及真正的独创性火花。
这些在数学和编程竞赛中的突破,共同展示了 Gemini 在抽象问题解决能力上的深远飞跃——标志着我们在通往通用人工智能(AGI)的道路上迈出了重要一步。”
来自谷歌 DeepMind 及谷歌研究院首席科学家 Jeff Dean发帖庆祝:

新知识发现的前沿
2025 年的 ICPC 总决赛清晰地表明了,在纯粹的、高强度的智力竞赛中,顶尖的 AI 模型已经超越了人类的极限。
正如 OpenAI 所强调的:“下一个前沿是新知识的发现,这才是最终真正的里程碑。”
当下的胜利,是新纪元的起点:一个强大的 AI 推理工具走出实验室,开始被应用于解决更宏大、更开放的科学难题的起点。全世界都在期待,这种卓越的推理能力,将如何帮助人类去探索未知、加速科学发现的进程。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!