谷歌与OpenAI同获ICPC 2025金牌!GPT-5满分夺冠,Gemini攻破人类队伍都没解出的难题

AI科技大本营 2025-09-19 18:33
资讯配图
整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)

在过去几十年里,国际大学生程序设计竞赛(ICPC)一直被视为计算机程序设计领域的“奥林匹克”。然而今,赛场上的风头却被两位“非人类”选手抢走——OpenAI 的 GPT-5 和 Google DeepMind 的 Gemini 2.5 DeepThink。

GPT-5 和 Gemini 2.5 Deep Think 作为参赛模型,受 ICPC 官方规则与组织监督,参与了与人类选手相同的解题环节。虽然它们并非与学生团队直接同场竞技,却交出了惊艳答卷:

 GPT-5 拿下满分,12 道题全解,相当于“金牌”水准。

 Gemini 2.5 Deep Think 在 677 分钟内解出 12 题中的 10 题,也达到金牌级别。根据谷歌的说法,这样的成绩放在人类排名里将是全球第二。

要知道,本届 ICPC 的人类金牌队伍来自圣彼得堡国立大学、东京大学、北京交通大学和清华大学。即便是这些顶尖学府的强队,也没有任何一支做到全对(最好成绩是 11/12)。换句话说,这是 AI 第一次在这类算法竞赛中实现了“超车”

资讯配图

资讯配图

ICPC:程序员的“林匹克

ICPC 是全球最顶尖的大学生编程事,自 1970 年代起,这项赛事就汇聚了全球高校最顶尖的算法天才。今年ICPC 总决赛共有来自 103 个国家、139 所高校的战队参赛大赛规则看似简单

 每支队伍由三名大学生组成;

 5 小时内解答 12 道算法题;

 排名取决于解题数和用时。

但背后的难度远超一般编程比赛。据悉,ICPC 的题目常涉及图论、数论、动态规划、组合优化、网络流等前沿算法。既考察编码速度,也考察数学功底与团队合作。历年来,能在 ICPC 拿到金牌的队伍,几乎都成为全球科技公司的核心技术人才。

也正因为 ICPC 的权威与挑战性,本届 AI 的入局显得尤为标志性:这是把AI直接推上了最严苛的算法竞技场。


资讯配图

GPT-5 给出完美答卷Gemini 2.5 解出人类没有答出的问题 C

根据 OpenAI 官方披露,GPT-5 参赛时并没有针对 ICPC 做特别训练,也没有任何“外挂”工具。它像其他人类队伍一样:直接拿到同样的 PDF 赛题通过官方判题系统提交答案在 5 小时内完成所有解答。

结果令人瞠目:有 11 道题都是一遍过,唯一的难题在第 9 次提交时才解出最终达成 12/12 满分——要知道,今年人类最强队伍的成绩是 11/12,而 GPT-5 直接拿下满分,这在 ICPC 的历史上极为罕见。

基于此OpenAI 在 X 平台分享了 GPT-5 的成绩:

“我们在 ICPC 的 AI 赛道正式参赛,同样是 5 小时解 12 道题,答案由 ICPC 评测系统实时判定。结果显示,12 道题中有 11 道题一次提交就通过,最难的一题则是在第 9 次提交时才解出。最终,GPT-5 完成了全部 12 道题,而最好的人类队伍只解出 11 道。”

与此同时Google 也公布了 Gemini 2.5 Deep Think 的比赛细节:45 分钟内解出 8 题;3 小时内解出 10 题;更令人震惊的是,Gemini 在比赛前半小时内,成功解决了问题 C——一道没有任何大学队伍解出的难题。

资讯配图

据悉这道题目要求:在由多个水库和管道组成的复杂网络中,找到一种管道开关配置,使所有水库在最短时间内被注满。每条管道可以开、关或部分开启,组合几乎无限,导致搜索最优解极其困难。

面对这道题Gemini 2.5 Deep Think 的解题思路堪称“巧妙”:

1先为每个水库设定一个“优先级值”,表示它相对于其他水库应被分配的程度;

2在给定优先级值后,通过动态规划找到最优管道配置;

3进一步应用极小化极大定理,将问题转化为寻找“最受约束”的优先级组合

4最后在凸优化空间中,利用嵌套三分搜索快速收敛到最优解。

这一思路并非赛题官方题解的“标准做法”,而是模型自己推演出的路径。换句话说,Gemini 在赛场上展示了超越记忆的原创性算法思维。Google 在博客中强调,这不仅是一次正确解答,更是一次“创造性突破”。


资讯配图

为什么这次意义非凡?

其实,大模型在各种考试、基准测试中高分表现早已不是新闻:

 ChatGPT、Gemini 等 LLM 在 SAT、律师资格考试、托福等人类考试中屡屡高分;

 今年7,Gemini在国际数学奥林匹克(IMO) 拿到金牌;

 各种 NLP、逻辑推理 benchmark 上,LLM 早已“刷榜”。

但这些成绩往往被质疑为“靠记忆训练数据”或“靠海量算力暴力搜索”。而 ICPC 这种现场算法竞赛不同:首先题目新颖,几乎不可能出现在训练语料中;其次需要综合运用数学建模、推理和代码实现;最为重要的是必须在有限时间内找到解法,而不是离线慢慢思考。

此次GPT-5 与 Gemini 2.5 Deep ThinkICPC的表现,证明它们已经具备临场推理、抽象建模、创造性解题的能力这比在标准化考试中得高分更能说明问题。为此社交媒体上,许多 AI 工程师感叹:“过去我们担心 AI 只是会背题库;现在它在现场比赛里击败人类冠军。这感觉像是见证了‘人机智力平权’的时刻。”

这不是终点,而是一个开始。接下来,AI 是否会把这种能力扩展到更复杂的现实问题还有待考验但可以确定的是:如今,AI 不再只是“会写代码的助手”,而是真正具备了与人类智力正面对抗的实力。

推荐阅读:

GPT-5与Transformer共同发明人Lukasz Kaiser重磅加盟,2025 全球机器学习技术大会全日程官宣!

“我用Java 8”已成过去式!Java 25正式发布:Oracle提供八年更新、18项新功能上线

从中国“霸榜”到全球开源,AI的新思考!GOSIM HANGZHOU 2025圆满收官

资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI EMI IC
more
科技快讯 | 淘宝闪购团购业务已试点上线;苹果iPhone Air海外发售首日,部分用户反馈镜头内出现水雾...
NVIDIA投资英特尔,双方将共同开发AI计算产品
Open AI “自曝家丑”!证实机器人训练的真相,承认AI大模型一直在“撒谎”
全球AI云战场开打:微软云、AWS 向左,谷歌、阿里云向右
终结CMU霸权,清华首次登顶CSRankings世界第一!北大AI领域夺冠!
布局AI/AR眼镜!三安光电碳化硅光学衬底小批量交付
陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型,性能登顶行业基准
趋势丨高功率需求倒逼,AI电源芯片赛道沸腾
重磅启航!头部科技×溪有物种「AI超级增长启航营」开启招募啦~
OpenAI从苹果挖了20多人搞硬件,知情人士:苹果创新缓慢、官僚主义令人厌倦
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号