十年前的今天，AI 用「神之一手」给人类上了一课

今天，距离改变世界的李世石大战阿尔法狗（AlphaGo），已经整整过去了十年。

多年后，李世石在接受外界采访时，仍难以忘怀当时的感受：「输给 AI，有种感觉是，我整个世界都塌了。」

他当初在接受邀请时，觉得那会是一次「好玩」的经历：「好玩的前提是我觉得会赢。我从未想过自己会输。」

这份自信并非傲慢。围棋长期被视为 AI 难以攻克的最后堡垒——棋盘上可能的局面数量高达 10 的 170 次方，远超宇宙中原子的总数，传统算法根本无从穷举。

正因如此，许多专家当时预测，AI 要赢过人类顶尖棋手，至少还需要十年。然而，AlphaGo 提前了十年。

这场比赛中，有一个细节后来被反复提起：第二局的第 37 手。AlphaGo 将棋子落在了一个人类职业棋手几乎不会考虑的位置。

现场解说员一度认为这是失误，观众席上的棋手们面面相觑。但一百多手之后，那颗棋子恰恰处于制胜的关键位置——它的价值，在百步之后才得以显现。

这就是著名的「第 37 步」。

今天，DeepMind 创始人 Demis Hassabis 在 X 平台发文称：

十年前，AlphaGo 在首尔的那场传奇比赛开启了人工智能现代时代的大幕。著名的「第 37 步」向我们表明，AI 技术已准备好应对科学等领域中的现实世界问题——而这些方法所激发的新思路对于构建通用人工智能（AGI）至关重要。

「第 37 步」也成了一个流传至今的隐喻：它代表那些看起来不合理、却最终被证明正确的决策；代表超出人类直觉边界的创新；也代表在某个系统或竞争中，突然改变局面的关键一步。

击败人类后，更强的 AI 在进一步去「人味」

「我没有办法再去享受围棋，所以我就退役了。」

与 AlphaGo 对战的三年后，李世石正式宣布退役。对于 5 岁就开始学围棋的他而言，围棋不仅是竞赛，更是一种艺术，是棋手个性与风格的延伸。但在 AI 时代，它却沦为效率的游戏。

让他更难释怀的，是 AI 还在继续进化，且越来越「去人化」。

2017 年，DeepMind 发布了 AlphaGo Zero。AlphaGo 的诞生，依赖神经网络对人类高手 3000 多万手棋谱的学习；而 AlphaGo Zero 从一开始就彻底抛弃人类经验，训练期间不接触任何棋谱，单纯靠自我对弈从零生长。仅仅三天后，它便以 100:0 击败了 AlphaGo。

《大西洋月刊》称其为「不需要从人类身上学习任何东西的 AI」。

DeepMind 并未止步。此后推出的 AlphaZero，在不具备任何先验知识的前提下，仅凭规则便在数小时内自学掌握了国际象棋，不仅击败了人类顶尖棋手，更超越了当时最强的专业象棋程序 Stockfish。

而象棋已被人类和计算机研究分析了数十年。连在这样一个被反复「穷举」过的领域，AlphaZero 依然走出了人类从未尝试过的新策略。

AlphaGo 和 AlphaGo Zero 的棋谱，难以理解到被棋手们直接称为「外星文明投下的一本神秘指南」。

美国职业棋手 Michael Redmond 于 2017 年表示，人类学习围棋的重要方式是搭建一个故事：「那是我们沟通的方式，它是一件非常人性的事。」面对「AI 味」棋路，他说，人类棋手往往很难真正投入其中：「AlphaGo 下棋的方式，总让人觉得很非人性。」

这也正是李世石痛苦所在。围棋对他而言从来不只是胜负，而是表达自我的语言。而「第 37 步」恰恰说明，这门语言里，AI 已经有了人类读不懂的章节。

退役后，李世石开始执迷于 AI，开设围棋学院、出书、推出桌游之余，还开始在各地做关于 AI 的演讲：「我算是很早开始面对 AI 的问题，其他人也将会经历。那未必会有开心大团圆结局。」

对他来说，AI 最让人担忧的地方，在于它可能改变人类的价值观：「过去，人们会对创造力、原创性和创新充满敬畏，但自从 AI 出现以来，这些很多都已经消失了。」

人机共创时代

并不是所有人都同意这个讲法。

「AI 毁灭了围棋圈所有存在的秩序，然后开始重建。」康奈尔大学研究 AI 的围棋爱好者 Jiuheng He 如此描述。

在香港一家围棋学院里，老师 Ng Chee Man 会为学生提供 iPad 来辅助学习——每次落子，AI 都会实时给出「最佳走法」建议，并记录下哪些步下得好，哪些不好。这种训练方式，正在成为全球围棋学院的标配。

数据也印证了这一转变。2023 年，《美国国家科学院院刊》发表了一项以 1950 至 2021 年共 580 万手棋谱为基础的研究，结论令人振奋：在 AlphaGo 击败李世石之前，人类棋手的判断质量在 66 年间几乎没有变化；但从 2016、2017 年起，这一数字开始明显攀升。

换言之，人类赢不了 AI，但因为 AI，人类变得更强了。

DeepMind 首席研究科学家、AlphaGo 项目负责人 David Silver 评论道：

「看到人类棋手能如此快速地适应，将这些新走法融入自己的方法中，正是让人非常振奋的事。这些结果表明，人类将在 AI 发现的基础上，大大提升自身潜力。」

事实上，早在 AlphaGo 公开亮相前，这一规律就已有迹可循。曾在不公开测试中对决 AlphaGo 的法国棋手樊麾，虽然落败，却说 AlphaGo 让他以全新方式审视围棋，技术因此飞速提升，世界排名随之跃升。

2017 年被 AlphaGo 击败的柯洁，在 2023 年也坦言，自己除了正式比赛外，已经很少与真人练习。在他看来，AI 已经成为围棋创造力的新源头：

创造性必须投入实战并得到检验。现在围棋创新的大部分是 AI 来完成，我们想下一些和以前不一样的棋，大概率会输，因为 AI 通过大量实战，得出了和之前不同的思维——这才是创造力。

这种人机协作的思维，在新生代棋手身上体现得最为彻底。韩国棋手申真谞，首位夺得世界冠军的 00 后棋手，棋迷称他「申工智能」，正是以长时间的 AI 训练著称。

他曾于第 25 届农心杯实现跨赛季 16 连胜，超越前辈李昌镐的历史纪录。谈及与 AI 的关系，他说：「我觉得我和 AI 现在是朋友关系。AI 和人类的思路完全不同，它通过数学算法解决问题，借鉴 AI 的思路使我受益良多。」

从李世石的崩塌，到申真谞的崛起，恰好是同一枚硬币的两面：前者是第一代直面冲击的人，后者是第一代将冲击化为养分的人。「第 37 步」对他们的意义，截然不同。

十年前，「第 37 步」告诉世界：AI 能走出人类从未想到的路。十年后，围棋这面镜子告诉我们：真正的问题从来不是人类能否赢过 AI，而是人类如何与它一起，走向那些连 AI 也尚未到达的地方。