AI，让阿里巴巴重回巅峰

让阿里巴巴重回巅峰的口号已经在公司内部流传了一年多——而数据表明，这正在成为现实。

内容太长了，文末添加了播客可以听。

这家中国电子商务和云计算巨头刚刚交出了自 2022 年以来最好的年度业绩。截至 2025 年 9 月 19 日，其股价今年迄今已上涨超过 90%，这场涨势的背后是其快速成熟的 AI 业务推动。在 2025 年第二季度，该公司的 AI 相关产品收入实现了三位数的猛增，同时云业务销售额同比增长 26%，超出了华尔街的预期。

在 9 月份的 2025 年云栖大会上，首席执行官吴泳铭雄心勃勃地表示，阿里巴巴正在执行一项为期三年、总额 3800 亿元人民币（530 亿美元）的 AI 和云基础设施投资计划，并将该公司的大语言模型系列通义，定位为 AI 时代的安卓操作系统。

吴泳铭发表此番言论的同时，阿里巴巴在全球开源 AI 领域的领导地位也日益获得认可。根据该公司的数据，通义已成为全球最大的开源模型家族，累计下载量超过 4 亿次，并衍生出 14 万个模型。全球的开发者和企业一直在利用通义来创建 AI 产品，例如日本的客户服务聊天机器人和车载集成助手。

在大会上，阿里云 CTO 周靖人发布了一系列全新的 AI 模型。其最新的一万亿参数大语言模型 Qwen3-Max，在智能体基准测试中超越了包括 Claude Opus 4 和 DeepSeek V3.1 在内的竞争对手。他还发布了另外六款模型，涵盖从万相 2.5 视频生成器到多模态的 Qwen3-VL，这标志着阿里巴巴正致力于在 AI 领域的每一个角落争夺主导地位。

这种激进的发布节奏并不新鲜。仅在最近几周，阿里巴巴就推出了 Qwen3-Next（其性能相当，但训练成本显著降低）以及一个用于深度信息检索的开源智能体模型——通义 DeepResearch。在备受推崇的语言模型评估基准 Artificial Analysis 上，两款阿里巴巴的模型跻身前十。

这个速度是残酷的：根据非官方统计，阿里巴巴在不到两年的时间里发布了 357 个模型。

截至 2025 年 9 月 12 日数据

“我们是（中国）唯一一家既经营着领先的云业务，又在 AI 领域具有竞争力的公司，”阿里巴巴董事长蔡崇信 2024 年在一次摩根大通的活动上表示。“AI 和云的结合非常重要。”

除了模型和云，阿里巴巴正在将其 AI 融入其庞大商业帝国的各个角落，从基础芯片到面向消费者的应用程序。该公司正在利用其自研的 AI 芯片来训练大语言模型。其企业解决方案（如钉钉）和面向消费者的应用（如夸克）在 AI 的驱动下，已成为各自领域强有力的竞争者。阿里巴巴的通义模型也正在为最新的消费电子产品（包括 RayNeo 的智能眼镜）进行定制。

RayNeo 的 AR 智能眼镜

本专题文章探讨了阿里巴巴——这家曾经以电子商务闻名的公司——如何转型成为一个 AI 巨头，这是一个连亚马逊都未能实现的转变。鉴于该公司的规模，一篇报道不可能涵盖其所有的 AI 业务和应用。因此，本文的重点是通义 (Qwen)。

1. 达摩院与 M6

在我们深入探讨通义 (Qwen) 之前，我们需要了解它的起源和背景：通义是凭空出现的吗？它的源头在哪里？

回到 2014 年，阿里巴巴已经是中国的电子商务巨头。凭借充裕的现金和历史性的美国 IPO，该公司成立了其研发部门——数据科学与技术研究院。该研究院位于硅谷、西雅图、北京和杭州，负责推动语音识别、计算机视觉和机器学习等技术的前沿发展。

三年后，阿里巴巴达到了顶峰。当时其市值高达 4700 亿美元，超越了亚马逊。阿里巴巴拥有 25000 名工程师和超过 5 亿用户。创始人马云想要的不仅仅是电子商务业务，他希望阿里巴巴成为一家伟大的公司。正如微软、贝尔实验室和 IBM 建立的研究实验室塑造了整个行业一样，阿里巴巴也需要自己的实验室。

因此，在 2017 年，马云宣布成立达摩院——其缩写代表发现、冒险、动力和展望。达摩院承诺在未来三年内投入 150 亿美元，旨在成为一个世界级的研究中心，解决从自动驾驶到量子计算的各种问题。阿里巴巴将 iDST 和其他核心实验室并入达摩院，创建了一个庞大的结构：五个机器智能实验室、三个计算与数据库实验室、一个机器人实验室、三个金融科技实验室，外加量子和探索性 AI 领域的前沿 X 实验室。

从一开始，自然语言处理和大语言模型并不是达摩院的核心焦点，因为语言技术并不被认为是阿里巴巴电子商务核心的关键。然而，与此同时，一场革命正在太平洋彼岸酝酿：2017 年，谷歌研究人员发明了 Transformer 架构，该架构悄然开始了对 NLP 领域的重塑。

2018 年 10 月，谷歌发布了 BERT，这是一个基于 Transformer 的 1.1 亿参数模型，它在语言理解方面表现出色，使其在解释搜索查询背后的意图等任务上非常有效。

两年后，即 2020 年 5 月，OpenAI 发布了 GPT-3。这是一个里程碑式的大语言模型，它不仅展示了惊人的语言生成能力，而且在理解能力上也超越了 BERT。其规模震惊了 AI 社区：1750 亿参数——这在当时被认为是不可思议的。

尽管新冠疫情 (COVID-19) 阻碍了国际学术交流，但这股冲击波还是传到了中国。受到美国突破的启发和警示，中国的 AI 实验室纷纷开始训练自己的大语言模型。国家支持的北京智源人工智能研究院推出了悟道项目。百度在一年内推出了文心 3.0。华为启动了其盘古大语言模型。

达摩院方面则启动了两个项目：M6 和 AliceMind。M6 是阿里巴巴追赶 GPT-3 的尝试，由周靖人（达摩院智能计算实验室负责人）、科学家杨红霞以及周畅、林俊旸等年轻研究员（注：周和林后来在通义项目中发挥了关键作用）领导。

到 2021 年，达摩院已将 M6 扩展到 10 万亿参数——在当时是世界上最大的 AI 模型。更令人印象深刻的是其效率：阿里巴巴仅用 10 天就在 512 个 GPU 上完成了 M6 的训练，声称其能耗仅为同等规模 GPT-3 消耗能量的 1%。M6 是一个多模态模型，使用了 200GB 的文本和 2TB 的图像进行训练。这使其非常适合电子商务，可以生成产品描述、设计广告活动和勾勒时尚概念。然而，M6 并非专用于开放域语言生成或推理，因此其写作和问答能力远远落后于 GPT-3。

M6 的训练语料库

M6 并不是达摩院的唯一尝试。达摩院机器智能实验室构建了 AliceMind，这是一套语言模型，其中包括 PLUG——一个 270 亿参数的编码器-解码器模型。AliceMind 的根源可以追溯到 StructBERT，这是阿里巴巴 2019 年推出的一个模型，旨在更好地捕捉单词和句子的顺序。

但在研究取得进展的同时，阿里巴巴作为一家公司却步履维艰。2021 年至 2022 年期间，作为中国大型科技公司监管整顿的一部分，监管机构对其处以创纪录的 182 亿元人民币（28 亿美元）罚款，相当于其 2019 年收入的 4%。在截至 2022 年 3 月的财年中，阿里巴巴公布了有史以来最慢的收入增长，其股价暴跌了一半以上。

随着公司的蹒跚前行，据报道，达摩院在 2022 年裁员 30%，并被要求实现盈亏平衡。尽管阿里巴巴否认了这一消息，但其研究部门失去了一些重量级人物。离职者包括副院长金榕（他也是 iDST 的院长）、领导 AliceMind 和 StructBERT 项目的 NLP 负责人司罗、城市大脑项目负责人、XR 实验室负责人以及自动驾驶负责人。M6 项目的策划者杨红霞也很快跳槽到了字节跳动。这是掏空达摩院领导层的第一波人才流失潮。

周靖人填补了这一真空。他被提升为阿里云 CTO，并迅速成立了通义实验室，整合了达摩院幸存的 NLP 团队（该实验室建于 2022 年至 2023 年之间，但不幸的是我找不到任何公开信息来确定具体时间）。

周靖人，阿里云 CTO 兼通义实验室负责人

这一举措至关重要——一位 AI 专家朋友甚至将其描述为阿里巴巴自己的谷歌 DeepMind 时刻，指的是 2023 年谷歌将其 DeepMind 团队与 Brain 团队合并为一个专注的部门，称为 Google DeepMind。

到 2022 年，阿里巴巴将其 NLP 模型重塑为通义 (Tongyi) 品牌：一个由 M6 和 AliceMind 等通用模型组成的基础，以及一套不断增长的行业特定模型。同年，它还推出了 ModelScope，这是一个类似于 Hugging Face 的开源平台，提供各种预训练 AI 模型和工具。

这些举措共同为阿里巴巴未来的开源大语言模型计划奠定了基础。

2. 竞逐中国版 ChatGPT

2022 年 12 月，情况发生了变化。OpenAI 的 ChatGPT 从一个不起眼的实验室项目转变为病毒式的轰动。几周之内，数以百万计的人开始使用这个感觉像科幻小说一样的聊天机器人。

阿里巴巴拥有 M6，后来升级为 M6-OFA（它统一了各种跨模态和单模态任务），但两者都无法与 ChatGPT 背后的模型 GPT-3.5 相提并论。

在中国 AI 社区内部，ChatGPT 的成功结束了一场旷日持久的辩论。多年来，中国学者一直青睐 BERT 风格的双向模型，认为它们能提供更强的语言理解能力。然而，GPT 的单向、仅解码器架构却能够以前所未有的水平扩展模型的大小。

当 ChatGPT 问世时，阿里巴巴的研究人员意识到他们押错了宝。M6 的编码器-解码器架构虽然强大，但并非为 GPT 所擅长的那种流畅、开放域的对话而构建的。

尽管如此，到 2023 年 4 月——在 ChatGPT 首次亮相六个月后——阿里巴巴给出了自己的答案。在阿里云峰会上，该公司发布了通义千问（Qwen 是 Qianwen 的缩写），这是由周靖人的通义实验室创建的类似 ChatGPT 的聊天机器人。时任阿里巴巴董事长张勇登台宣布，阿里巴巴家族的每一款产品最终都将接入它。通义千问被定位为一个多模态聊天机器人，可以生成文案、回答问题、总结文本、编写代码以及处理图像和视频。

张勇，阿里巴巴前董事长兼 CEO，于 2023 年 4 月宣布了通义千问

然而，与其竞争对手——月之暗面的 Kimi 和字节跳动的豆包——大张旗鼓地进行营销不同，通义千问逐渐沉寂了。通义千问曾有一些功能在中国社交媒体上走红，比如让兵马俑跳舞。但热潮退去后，这款应用也随之沉寂。

这款聊天机器人被定位为阿里巴巴 AI 推进的门面。通义千问与阿里云的服务打包在一起，更多的是为了展示肌肉，而不是作为一款严肃的消费级产品来定位。

公司内部的各个部门也对此印象不深。据 The Information 报道，许多业务单位要么自己构建模型，要么依赖外部供应商。阿里妈妈、阿里巴巴国际站和蚂蚁集团都各自开发了独立的大语言模型。

部分问题在于结构。2023 年初，阿里巴巴公布了其“1+6+N”的重组计划，将公司从一个中央集权的公司转变为一个业务联邦。“1”指的是作为控股公司的阿里巴巴集团，而“6”涵盖了其六大核心业务单元——云智能、淘宝天猫商业、本地服务、菜鸟物流、全球数字商业以及数字媒体与娱乐——每个单元都有自己的 CEO、董事会和 IPO 潜力。“N”代表拥有更大自主权的较小的、新兴的业务。在阿里巴巴“1+6”重组后，各业务单元拥有了更大的自主权，也就更没有动力去依赖中央的基础设施。

此外，该模型在 2023 年远非领先者。在中国的 LLM 评估基准 SuperCLUE 上，通义千问在当年 5 月至 8 月期间未能排进前八，直到 10 月阿里巴巴发布了通义千问 2.0。一位 AI 专家曾在 2023 年告诉我，他担心阿里巴巴可能会在中国的 LLM 竞赛中掉队。

2023 年 9 月的 SuperCLUE 基准测试

就连阿里巴巴自己似乎也在犹豫是否要押注于其自研技术。相反，它转向了投资。

3. 错失恐惧式投资

2023 年初，ChatGPT 的发布在中国引发了连锁反应。企业家们纷纷涌入生成式 AI 领域：杨植麟创立了月之暗面，王小川推出了百川智能，而像 MiniMax 和智谱 AI 这样稍早（均成立于 2021 年左右）的公司也迅速转向聊天机器人竞赛。几个月内，他们推出了大语言模型，引入了聊天产品，并筹集了数亿美元。媒体将他们称为中国的 AI 四小龙。

将这些初创公司推向独角兽地位的力量来自阿里巴巴。2023 年 9 月，该公司任命其联合创始人兼前 CFO 蔡崇信——这位阿里巴巴崛起背后的天才交易撮合者和金融架构师——担任董事长。从那时起，该公司打开了它的支票簿。

2023 年 10 月，百川智能从阿里巴巴、腾讯和小米处筹集了 3 亿美元。
同月，智谱 AI 获得了 25 亿元人民币（约 3.5 亿美元）的投资，阿里巴巴和腾讯均参与其中。
2024 年 2 月，阿里巴巴领投了对月之暗面的 10 亿美元融资，将其估值推高至 25 亿美元；几个月后，该公司在其年报中披露，已持有其 36% 的股份，价值约 8 亿美元。
到 3 月，MiniMax 获得了由阿里巴巴领投的 6 亿美元融资，使该创业公司估值达到约 25 亿美元。
7 月，阿里巴巴又参与了一轮 6.91 亿美元的融资，将 MiniMax 的估值推高至近 30 亿美元。

这个剧本看起来很熟悉。微软通过数十亿美元的现金和云 GPU 资源为 OpenAI 提供了强大动力，从而为 Azure 云带来了实实在在的收入增长。拥有自己云服务的阿里巴巴可以为中国初创公司做同样的事情：向 AI 实验室注入资金，然后将其训练负载转移到阿里云上。在此过程中，它刺激了对 GPU 的需求，并确保了自己在未来可能主导市场的任何一家初创公司中都占有一席之地。通过投资所有这四家公司，阿里巴巴不需要去挑选赢家；它自己变成了庄家。

阿里巴巴不只是在押注 LLM 的构建者。2025 年 3 月，Manus AI 宣布与阿里巴巴通义模型背后的团队建立战略合作关系。两个月后，阿里巴巴认购了美图 (Meitu) 发行的 2.5 亿美元可转换债券，这家社交媒体公司正大举进军 AI 驱动的智能体领域。

然而，投资戛然而止，同样迅速。2024 年年中之后，阿里巴巴没有对中国的 LLM 公司进行任何新的投资。原因很简单：它自己的模型开始获得关注了。

4. 开源的通义 (Qwen)

通义千问最初推出时，是一个闭源模型。但在 2023 年 8 月，阿里巴巴出人意料地宣布：将通义千问家族的关键模型开源，并命名为 Qwen（通义）。Qwen-7B（一个 70 亿参数的模型）及其聊天调优版本在宽松的许可下发布，可用于研究和商业用途。

此举在一定程度上是受 Meta 在一个月前发布 Llama 2 的推动。Llama 2 降低了竞争对手跟进的门槛，但它在中文上的表现不佳。这给国内市场留下了一个空白——阿里巴巴介入填补了这一空白。一家中国科技巨头将其模型免费提供下载、微调甚至商业化，这是一个罕见的举动。当时大多数同行，如字节跳动和腾讯，仍像 OpenAI 一样将他们的系统保护在 API 之后。

阿里巴巴开源其模型是出于战略原因，而非利他主义。正如蔡崇信后来的解释，通过开源核心模型，阿里巴巴期望使用量——包括训练、推理和部署——将会增加，这反过来又将推动对其云服务和基础设施的需求。换句话说，免费模型有助于建立一个市场和生态系统，然后他们可以通过云计算将其变现。

阿里巴巴通义开源项目的核心人物是 32 岁的研究员林俊旸，他也参与了 M6 和通义千问的开发。与大多数来自计算机科学或工程背景的 AI 科学家不同，林俊旸学习的是语言学。他在北京大学获得了语言学及应用语言学学士学位。

林俊旸，阿里巴巴 Qwen 开源项目的负责人

六周内，阿里巴巴接着发布了 Qwen-14B 和一份技术报告——这是第一家发布如此详细文档的中国公司。尽管 Qwen-7B 的规模不大，但它在 Hugging Face 的开放 LLM 排行榜上，位列 100 亿参数以下模型的榜首。到 8 月底，该公司又推出了 Qwen-VL，这是一款能够处理文本和图像的多模态模型，展示了类似于 OpenAI 自己的视觉系统的能力。

从那时起，发布的节奏加快了。2023 年 12 月，带来了 Qwen-72B 和 Qwen-1.8B，一对高端和低端组合，以及用于语音理解的模型。到 2024 年，通义家族已经涵盖了自然语言、视觉和音频——成为世界上最全面的开放模型家族之一。

2024 年 6 月，阿里巴巴推出了 Qwen2，其旗舰 72B 模型在 15 个基准测试中取得了业界最佳结果。三个月后，Qwen2.5 问世，包含从 5 亿到 720 亿参数的 100 多个模型，具有更强的编码和数学能力，并支持 29 种语言。这是通义系列第一次真正在中美两国的开发者社区中获得广泛关注。

与此同时，阿里云加大力度，说服其他业务部门在其所有 AI 产品中采用通义模型。员工们主动接触开发 AI 功能的团队，试图建立更紧密的联系。

尽管阿里巴巴仍然同时关注通义的专有版本和开源版本，但在整个 2024 年，平衡点发生了变化。随着开源模型开始从中国和美国的开发者那里获得稳定的反馈，初创公司、学术研究人员和博士生开始使用它们来构建定制的 AI 系统。这股势头逐渐将阿里巴巴的重心推向了开源。

到 2024 年底，中国的 AI 战争已经缩小到两个巨头之间：阿里巴巴和字节跳动。字节跳动的模型在性能上正在缩小差距，其聊天机器人登上了应用下载排行榜的首位。与此同时，阿里巴巴也在积聚势头——其通义模型赢得了开发者的青睐，其云部门在企业市场飙升，年初的一系列投资带来了新的盟友。

当字节跳动挖走通义背后的技术负责人周畅时，这场竞争变得白热化。阿里巴巴以仲裁案回击，指控他违反了竞业限制和禁止招揽协议。

5. 通义 (Qwen) vs. DeepSeek

到 2024 年底，OpenAI 发布了 o1 模型，并揭示了一种名为推理时计算的新范式——通过一种称为强化学习的技术，扩展推理计算来提高模型的推理能力。

阿里巴巴迅速跟进，在 11 月表示他们正在试验一种名为 QwQ 的类似专用推理模型。

但在它发布之前，该公司遭到了突袭。DeepSeek（当时一家鲜为人知的中国初创公司，由量化交易巨头幻方支持）发布了 R1，这是一个可与 OpenAI o1 相媲美的开源推理模型。随后，用于训练 DeepSeek-R1 的方法论发表在了《自然》杂志上。

DeepSeek-R1 载于《自然》杂志 2025 年 9 月 18 日封面

这一发布引起了轰动，迅速将 DeepSeek 推上了中国 AI 标杆的地位。开发者蜂拥至 R1，企业开始将其嵌入到应用程序中，甚至阿里巴巴自己的旅行部门飞猪也宣布了集成。阿里巴巴一年来悄悄建立的社区似乎有被一夜抹去的风险。

“我们读了研究论文后说，‘天哪，我们怎么会落后了？我们当时在做同样的事情，’”蔡崇信今年 6 月在巴黎 2025 年 Viva Tech 科技大会上说道。

“发生的事情是，我们的工程主管决定并说，‘取消你们的春节假期，每个人都待在公司，睡在办公室，我们要加快我们的开发速度。’”

顶着压力，阿里巴巴的 AI 部门没有退缩。在春节的第一天——本应是中国人休息和与家人团聚的日子——该公司发布了 Qwen2.5 Max，其最新一代 LLM 性能优于 DeepSeek-V3。

三个月后，Qwen3 问世，这是其迄今为止最雄心勃勃的 LLM。已经退休六年的马云，开始要求周靖人定期汇报进展——这标志着通义的战略重要性已非同一般。该系列模型参数范围从 6 亿到 2350 亿，采用了高效的混合专家设计，并将混合推理推向了主流应用。它在数学、编码和跨 119 种语言的多语言推理方面表现出色，支持高达 128,000 个 token 的上下文窗口，并且——至关重要的是——它是根据 Apache 2.0 许可证发布的。

Qwen3 技术论文

到 2025 年年中，通义家族的下载量已超过 4 亿次，在其基础上构建的衍生模型超过 14 万个，巩固了阿里巴巴在开源 AI 领域的中心地位。

随着通义势头渐猛，阿里巴巴的科学家们自己也成为了中国日益激烈的 AI 人才战中的热门目标。今年 1 月，达摩院早期成员、原通义语音实验室负责人鄢志杰加入了京东的探索研究院。不久之后，曾负责通义应用视觉部门的薄列峰叛逃至腾讯的混元 AI 团队。再加上早些时候离开的周畅，通义三个核心实验室——语言、语音和视觉——的最高负责人全都流失了。这标志着继 2022 年达摩院大规模离职潮之后，阿里巴巴遭遇的第二次严重人才流失。事实证明，中国的 AI 人才战，其残酷程度丝毫不亚于硅谷。

然而，阿里巴巴仍然具有吸引力。今年早些时候，在李开复放弃了训练自家 LLM 的努力后，阿里巴巴宣布与他创立的初创公司 01.AI 成立一个联合实验室。01.AI 的几位核心研究人员此后加入了阿里巴巴。

正如李开复所说：“最终，中国的 AI 市场可能只会剩下三家主要的模型公司：DeepSeek、阿里巴巴和字节跳动。”

6. 布局长远

2025 年 2 月，在迪拜举行的世界政府峰会上，董事长蔡崇信宣布，苹果公司已选择阿里巴巴作为其 Apple Intelligence 在中国的合作伙伴。这场胜利极大地提升了阿里巴巴在 AI 领域的信誉。

胜利也延伸到了资产负债表上。2025 年第二季度，阿里云收入同比增长 26%，其中 AI 销售额连续第七个季度实现三位数增长。面向消费者的应用也显示出意想不到的实力。夸克，这个曾经小众的搜索和云盘应用，正在转变为一个功能齐全的 AI 超级应用，赢得了年轻人的青睐。

接着，投资者渴望的数字出现了：3800 亿人民币（530 亿美元）。这是 CEO 吴泳铭承诺在三年内用于云和 AI 基础设施的支出金额——超过了该公司过去十年投资的总和。该消息宣布后，阿里巴巴的美国股价在几分钟内飙升了 11% 以上。

吴泳铭在 2025 年云栖大会上的演讲强化了他们的战略赌注：首先，LLM 将成为下一个操作系统，自然语言成为编程语言，而智能体成为新的软件——这就是为什么他们选择开源通义，将其作为“AI 时代的安卓”，以建立一个庞大的开发者生态系统。

其次，他们相信未来只有 5-6 个超级 AI 云能够存活下来，以处理未来 AI 世界海量的计算需求。在他们设想的人工智能超级智能时代中，每个人都可能使用价值 100 个 GPU 芯片的 AI 算力，智能体和机器人 7x24 小时工作，将人类智能放大 10 倍或 100 倍。如果 AI 变得像电力一样基础，阿里云将充当这种新形式数字能源的发电机和电网。

阿里巴巴还公布了他们的通义 (Qwen) 路线图，这代表了一种暴力扩展策略，旨在同时推动每一个技术边界：