今天,距离改变世界的李世石大战阿尔法狗(AlphaGo),已经整整过去了十年。 多年后,李世石在接受外界采访时,仍难以忘怀当时的感受:「输给 AI,有种感觉是,我整个世界都塌了。」 他当初在接受邀请时,觉得那会是一次「好玩」的经历:「好玩的前提是我觉得会赢。我从未想过自己会输。」 这份自信并非傲慢。围棋长期被视为 AI 难以攻克的最后堡垒——棋盘上可能的局面数量高达 10 的 170 次方,远超宇宙中原子的总数,传统算法根本无从穷举。 正因如此,许多专家当时预测,AI 要赢过人类顶尖棋手,至少还需要十年。然而,AlphaGo 提前了十年。 这场比赛中,有一个细节后来被反复提起:第二局的第 37 手。AlphaGo 将棋子落在了一个人类职业棋手几乎不会考虑的位置。 现场解说员一度认为这是失误,观众席上的棋手们面面相觑。但一百多手之后,那颗棋子恰恰处于制胜的关键位置——它的价值,在百步之后才得以显现。 这就是著名的「第 37 步」。 今天,DeepMind 创始人 Demis Hassabis 在 X 平台发文称: 十年前,AlphaGo 在首尔的那场传奇比赛开启了人工智能现代时代的大幕。著名的「第 37 步」向我们表明,AI 技术已准备好应对科学等领域中的现实世界问题——而这些方法所激发的新思路对于构建通用人工智能(AGI)至关重要。 「第 37 步」也成了一个流传至今的隐喻:它代表那些看起来不合理、却最终被证明正确的决策;代表超出人类直觉边界的创新;也代表在某个系统或竞争中,突然改变局面的关键一步。 击败人类后,更强的 AI 在进一步去「人味」 「我没有办法再去享受围棋,所以我就退役了。」 与 AlphaGo 对战的三年后,李世石正式宣布退役。对于 5 岁就开始学围棋的他而言,围棋不仅是竞赛,更是一种艺术,是棋手个性与风格的延伸。但在 AI 时代,它却沦为效率的游戏。 让他更难释怀的,是 AI 还在继续进化,且越来越「去人化」。 2017 年,DeepMind 发布了 AlphaGo Zero。AlphaGo 的诞生,依赖神经网络对人类高手 3000 多万手棋谱的学习;而 AlphaGo Zero 从一开始就彻底抛弃人类经验,训练期间不接触任何棋谱,单纯靠自我对弈从零生长。仅仅三天后,它便以 100:0 击败了 AlphaGo。 《大西洋月刊》称其为「不需要从人类身上学习任何东西的 AI」。 DeepMind 并未止步。此后推出的 AlphaZero,在不具备任何先验知识的前提下,仅凭规则便在数小时内自学掌握了国际象棋,不仅击败了人类顶尖棋手,更超越了当时最强的专业象棋程序 Stockfish。 而象棋已被人类和计算机研究分析了数十年。连在这样一个被反复「穷举」过的领域,AlphaZero 依然走出了人类从未尝试过的新策略。 AlphaGo 和 AlphaGo Zero 的棋谱,难以理解到被棋手们直接称为「外星文明投下的一本神秘指南」。 美国职业棋手 Michael Redmond 于 2017 年表示,人类学习围棋的重要方式是搭建一个故事:「那是我们沟通的方式,它是一件非常人性的事。」面对「AI 味」棋路,他说,人类棋手往往很难真正投入其中:「AlphaGo 下棋的方式,总让人觉得很非人性。」 这也正是李世石痛苦所在。围棋对他而言从来不只是胜负,而是表达自我的语言。而「第 37 步」恰恰说明,这门语言里,AI 已经有了人类读不懂的章节。 退役后,李世石开始执迷于 AI,开设围棋学院、出书、推出桌游之余,还开始在各地做关于 AI 的演讲:「我算是很早开始面对 AI 的问题,其他人也将会经历。那未必会有开心大团圆结局。」 对他来说,AI 最让人担忧的地方,在于它可能改变人类的价值观:「过去,人们会对创造力、原创性和创新充满敬畏,但自从 AI 出现以来,这些很多都已经消失了。」 人机共创时代 并不是所有人都同意这个讲法。 「AI 毁灭了围棋圈所有存在的秩序,然后开始重建。」康奈尔大学研究 AI 的围棋爱好者 Jiuheng He 如此描述。 在香港一家围棋学院里,老师 Ng Chee Man 会为学生提供 iPad 来辅助学习——每次落子,AI 都会实时给出「最佳走法」建议,并记录下哪些步下得好,哪些不好。这种训练方式,正在成为全球围棋学院的标配。 数据也印证了这一转变。2023 年,《美国国家科学院院刊》发表了一项以 1950 至 2021 年共 580 万手棋谱为基础的研究,结论令人振奋:在 AlphaGo 击败李世石之前,人类棋手的判断质量在 66 年间几乎没有变化;但从 2016、2017 年起,这一数字开始明显攀升。 换言之,人类赢不了 AI,但因为 AI,人类变得更强了。 DeepMind 首席研究科学家、AlphaGo 项目负责人 David Silver 评论道: 「看到人类棋手能如此快速地适应,将这些新走法融入自己的方法中,正是让人非常振奋的事。这些结果表明,人类将在 AI 发现的基础上,大大提升自身潜力。」 事实上,早在 AlphaGo 公开亮相前,这一规律就已有迹可循。曾在不公开测试中对决 AlphaGo 的法国棋手樊麾,虽然落败,却说 AlphaGo 让他以全新方式审视围棋,技术因此飞速提升,世界排名随之跃升。 2017 年被 AlphaGo 击败的柯洁,在 2023 年也坦言,自己除了正式比赛外,已经很少与真人练习。在他看来,AI 已经成为围棋创造力的新源头: 创造性必须投入实战并得到检验。现在围棋创新的大部分是 AI 来完成,我们想下一些和以前不一样的棋,大概率会输,因为 AI 通过大量实战,得出了和之前不同的思维——这才是创造力。 这种人机协作的思维,在新生代棋手身上体现得最为彻底。韩国棋手申真谞,首位夺得世界冠军的 00 后棋手,棋迷称他「申工智能」,正是以长时间的 AI 训练著称。 他曾于第 25 届农心杯实现跨赛季 16 连胜,超越前辈李昌镐的历史纪录。谈及与 AI 的关系,他说:「我觉得我和 AI 现在是朋友关系。AI 和人类的思路完全不同,它通过数学算法解决问题,借鉴 AI 的思路使我受益良多。」 从李世石的崩塌,到申真谞的崛起,恰好是同一枚硬币的两面:前者是第一代直面冲击的人,后者是第一代将冲击化为养分的人。「第 37 步」对他们的意义,截然不同。 十年前,「第 37 步」告诉世界:AI 能走出人类从未想到的路。十年后,围棋这面镜子告诉我们:真正的问题从来不是人类能否赢过 AI,而是人类如何与它一起,走向那些连 AI 也尚未到达的地方。