
DeepSeek 爆火,不代表其它玩家就已经没有机会。
作者丨郑佳美
编辑丨陈彩娴
AI 科技评论独家获悉:近日,蚂蚁集团新设了「通用人工智能研究中心」,隶属于蚂蚁技术研究院,云集了蓝振忠、武威、吴翼、赵俊博等一众明星 AI 新秀,发力 AGI 基础技术研究。
事实上,早在今年年初就曝出蚂蚁设立 AGI 研究部门,不过上半年是隶属于蚂蚁集团 CTO 线,由何征宇直接领导。近日,或是为了更聚焦 AGI 的基础研究,强调技术创新、而非商业潜力,AGI 研究转向了研究院,并由蓝振忠担任中心主任,赵俊博、吴翼、武威等人向其汇报。
蓝振忠本科毕业于中山大学,后在卡内基梅隆大学(CMU)取得博士学位,研究方向涵盖计算机视觉与多媒体分析。他是 Google Lab 前科学家,也是知名轻量化预训练语言模型 ALBERT 的第一作者。
ALBERT 是 BERT 之后的重要架构创新,它在参数量上实现了惊人的压缩:模型参数仅为 BERT 的 1/18,但在多个任务上的性能却能达到 95% 以上甚至持平。不仅显著降低了大模型的训练与部署成本,也成为后续轻量化预训练模型设计的重要里程碑之一,广泛影响了移动端 AI、边缘计算等实际应用方向。
2020 年蓝振忠加入西湖大学,创建「深度学习实验室」并担任博士生导师。他是国内第一批大模型研究科学家,早在 2022 年就率先创立「西湖心辰科技」,是国内最早探索 AIGC、AGI 等技术产业化落地的团队,曾打造日活百万 AIGC 应用「造梦师」。2024 年 9 月,他因在人工智能领域的持续贡献,获得蚂蚁年度 InTech 科技奖。
此外,虽然担任蚂蚁 AGI 研究中心主任,但西湖心辰并不像行业传闻的「被收购」、而是仍在继续运营并聚焦应用落地,区别于蚂蚁的基础模型研究。

蓝振忠
除了蓝振忠,蚂蚁 AGI 研究中心目前披露的青年技术人才也是各怀绝技:
武威本科与博士均毕业于北京大学数学科学学院。2012 年加入微软亚洲研究院,历任主管研究员、小冰首席科学家。随后担任美团 NLP 中心负责人,在语言模型与应用场景结合方面经验丰富,现为蚂蚁 AGI 中心的重要技术骨干。
从 2023 年底开始,武威开始聚焦大模型的推理研究。在他的主导下,蚂蚁联合香港大学于 2024 年发布了 PromptCoT-Mamba,这是业内首个彻底去除注意力机制的大模型架构,完全不依赖 Key-Value Cache,解码显存消耗常量、计算复杂度随生成长度线性增长,同时具备强大的长链路推理能力。PromptCoT-Mamba-7B 不仅全面超越了同尺寸的 Transformer 与混合模型,甚至在部分评测中超过了 Google 的 Gemma3-27B,首次验证了无注意力架构在复杂推理任务中的工程可行性与性能潜力。
值得一提的是,尽管当前业界仍以基于注意力机制的 Transformer 架构为主流,近年来以 Mamba 为代表的非 Transformer 路线也在快速升温。PromptCoT-Mamba 的发布,无疑进一步推动了这一非主流架构在复杂推理领域的落地与发展。

武威
吴翼本硕就读于清华大学,博士阶段在加州大学伯克利分校深造,师从著名 AI 学者 Stuart Russell,专注深度强化学习与多智能体系统研究。吴翼曾在 OpenAI 任职,是为数不多在硅谷核心 AI 实验室做过一线研究的中国学者之一。
2020 年回国后,他加入清华大学任教,并创办边塞科技,致力于将大语言模型与强化学习结合应用,尝试将 LLM 与 RL 构建为完整闭环系统。在 RL 社区崛起之前,边塞科技就率先提出“Agent 结构化决策体系”,并获得包括蚂蚁在内的多家头部科技企业关注。2024 年,边塞科技正式被蚂蚁收购,成为其 AGI 战略的重要拼图。
作为国内强化学习方向最具代表性的科学家之一,吴翼始终致力于推动 RL 技术在通用智能方向的延展。他在 2024 年与清华团队联合发布的开源系统 AReaL,提出了新型“主动式强化对齐框架”,显著提升了模型的推理灵活性与环境泛化能力。
RL 作为目前实现 AGI 的重要技术,可以让模型具备目标感和适应变化的能力。相比传统方法, RL 关注如何在环境中试错、优化长期结果,是构建具身智能和多步骤决策系统的关键机制。它也是大模型走向智能体的基础,如通过人类反馈强化学习提升模型对人类意图的理解。虽然仍有效率和泛化上的挑战,但 RL 正在逐渐成为连接语言能力与智能行为的桥梁。

吴翼
赵俊博毕业于纽约大学,师从图灵奖得主、Meta 首席科学家 Yann LeCun。曾在 Meta(原 Facebook)人工智能实验室工作,参与 PyTorch 与向量数据库 Faiss 的开发,并主导了 Meta 内部对话机器人相关研究。他目前也是浙江大学“百人计划”研究员。

赵俊博
过去两年,相比其他互联网科技大厂与创业独角兽,蚂蚁集团在大模型技术发声中并不高调。而在 DeepSeek 爆火后才进场的蚂蚁,依然选择发力基础模型——这表明,他们相信自己在这场看似已经红海的竞争中依然能有所贡献。
期待蚂蚁基础模型接下来的成果发布。





未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。