Self-Evolving 会是 2026 关键词吗?

机器之心 2026-02-01 09:30

本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。

Self-Evolving 会是 2026 关键词吗?图1

在过去的 2025 年里,Agent 应用的极速发展使得 LLM 的「静态属性」局限被视为 AI 发展的关键瓶颈,业界对 LLM 和 Agent 的自进化(Self-Evolving)能力愈发重视,开始聚焦于构建「持续适应系统」。然而,该领域仍然缺乏区分短暂性能提升与通用能力和自主性真正进步的共同标准。有思潮认为通过统一新兴标准并鼓励集体探索,该领域正在面临巨大的机遇。

 

目录

01. Self-Evolving 在过去一年里有何进展?
为什么「Self-Evolving」越来越重要?学界和工业重视模型自进化能力的原因有哪些?...
02. Self-Evolving 的研究重点在如何演变?

「Self-Evolving」如何从思想实验变为工程现实?上半年和下半年的综述如何解构 Self-Evolving范式?AI顶会更关注哪些工作?...

03. 2026 年的 Self-Evolving 工作都在关注哪些问题?

如何在零数据环境下训练搜索增强型Agent?算法代码优化领域的自进化方法有何特征?元认知学习如何塑造自进化能力?...


Self-Evolving 在过去一年里有何进展?

1、2025 年里,LLM 能力的进步极大推动了 AI 的发展,使 AI Agent 应用开始渗透于各类任务与场景,也因而暴露出因「静态」属性所导致的局限。

① LLM 的「静态」(Static)属性指当遇到新任务、不断发展的知识领域或动态交互场景时,它们无法调整内部参数。随着 LLM 大型语言模型越来越多地应用于开放式交互环境,这一局限性被视为 AI 发展的关键瓶颈。

2、对动态持续适应能力的需求催生了对构建能够实时动态调整感知、推理和行动的智能体的探索,业界对 AI 的「自进化」(self-Evolving/self-Improvement)能力愈发重视,焦点开始从「静态预训练模型」向「持续适应系统」的根本转变。[1-1] 

① 图灵奖得主 Richard Sutton 是早期推崇 AI 自进化能力的代表,他先后提出了「Dynamic Deep Learning」、「经验时代(Era of Experience)」「Oak」架构等概念与设计。

3、在技术探索中,自进化范式仍处于发展初期,因其研究涉及基础模型、强化学习和在线学习、认知神经科学等领域的不同实践和交叉影响,带来了学界在不同方向下的探索和尝试,以及共识和非共识的交替。

① 在 2025 上半年以及之前,许多工作从 LLM 的思维链数据、模型组件和综合提升等视角探索模型自进化的能力,也有如 Sakana AI 的「DGM」试图通过让模型基于过往经验来改进自身代码。(详见 Pro 通讯 2025 Week 28)

② 进入 2025 年下半年,进一步涌现的探索工作发现强化学习或许不会是自进化范式的唯一答案,改善模型的记忆系统,或是加强模型内在元认知学习(IML)能力同样对 LLM 的自我改进能力带来帮助。(详见 Pro 通讯 2025 Week43、Week 46)

4、在 LLM 与 Agent 应用所带来的经济效能层面,多篇对 2026 年 AI 发展的趋势展望指出,企业开始寻求能够独立承担端到端流程的「Autonomous Worker」。只有具备自进化能力的系统,才能在无需人类频繁干预的情况下,处理长尾问题和动态异常。[1-2] [1-3] 


Self-Evolving 的研究重点在如何演变?

1、人工智能顶会 ICLR 2025 首次在研讨会(Workshop)中设置了「Scaling Self-Improving Foundation Models」的主题,探讨没有人类监督的情况下如何通过生成合成数据来持续提升模型性能。[1-4] 

① 该场研讨会首先区分了自进化与标准的监督学习(SL)和强化学习 (RL) 在几个关键方面的区别,并探讨了自进化范式对学习方法、数据等方面的特殊需求。

2、在新年伊始,ICLR 2026 为自进化范式设置的研讨会主题聚焦于「AI with Recursive Self-Improvement」(RSI),讨论「如何为强大且可靠的自我改进人工智能系统构建算法基础?」[1-5] 

① 此前,ICLR 2025 的「世界模型」「Agent 工具使用」和 NeurIPS 2024「自主发现」等研讨会均探究过模型自进化能力,但通常强调单一模态、前沿模型规模或算法细节,而未详细说明部署仪器化和安全实践。

3、根据该场研讨会的描述,LLM 的进展已将 RSI 从思想实验转变为工程现实。修改自身提示词、目标函数或权重的训练循环,现已成为基础模型开发和一系列下游应用的核心组成部分。因此当下有关 RSI 的研究应当明确学习系统如何学会安全且可证明地改进自身。[1-5] 

① ICLR 2026 设置了「改变目标」「适应时机」「适应机制」「运行环境」和「证据维度组织」五个维度来评估新出现的自进化研究工作。

4、伴随对 AI 自进化能力的兴趣不断增加与正视,但业界仍未在概念上明确到底是什么构成了所谓的「自进化」,因此有工作开始成体系地梳理该领域的研究框架,并逐渐丰富和完善...

 

 关注👇🏻「机器之心PRO会员」,前往「收件箱」查看完整解读 
Self-Evolving 会是 2026 关键词吗?图2
 

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
低空经济早报:1月13日
十大案例入选白皮书!中科星图以技术实力引领低空经济场景落地
低空经济早报:12月19日
低空经济早报:1月12日
低空经济早报:12月18日
低空经济:2025年eVTOL依然是“最亮的仔”,融资创新高!2026年将迈入“实质运营”!
年终盘点:2025年低空经济十大事件
低空经济早报:1月5日
低空经济早报:1月14日
低空经济早报:1月24日
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号