点击下方卡片,关注“具身智能之心”公众号
近日,智元自研的世界模型 Genie Envisioner-Sim 2.0(GE-2.0)登顶 WorldArena Challenge榜单,获得总冠军。值得关注的是,GE-2.0通过引入多样交互数据进行训练,进一步提升了世界模型对真实物理世界的建模能力。
所谓多样交互数据,往往是我们早已习惯的生活中的一些瞬间:碗放入水槽,水面会泛起一圈圈涟漪;乒乓球落地,会一次次弹起;塑料袋从空中掉落,会轻轻飘下。
对于人类来说,这些都是习以为常的经验。但对于机器人来说,它们正是理解物理世界最困难、也最关键的部分。这也是世界模型研究中的关键需求:机器人对世界的建模和预测需要真实丰富的交互数据,才能更好地理解物理世界的运行。
世界模型一直都缺少一批真正属于它的数据。
今天,智元开源AGIBOT WORLD 2026数据集主题二:“多样交互(Rich Interaction)”,旨在填补这一空白。这是行业首个聚焦物理交互的开源具身数据集,数据集不仅记录预期内的成功,更致力于捕捉机器人与真实世界之间那些多样、精细且充满接触的物理对话,以此还原物理智能的全貌。
项目主页:agibot-world.com
开源地址:huggingface.co/datasets/agibot-world/AgiBotWorld2026
点击阅读原文,跳转至项目主页
四月智元AI发布周首日,开源了数据集第一期“模仿学习”主题,此次的主题二“多样交互”则进一步走向机器人与真实物理世界之间更复杂、更高密度、更具不确定性的“交互学习”。
过去,具身数据集往往强调“专家示范”,可真实世界并不总是理想、可控的。机器人真正理解物理世界,不仅需要学习如何完成任务,也需要理解非理想情况背后的物理规律。
本期数据集突破了数据采集中仅关注成功案例的局限,直面现实物理世界中微妙的复杂性,捕捉“意料之外”的价值。采集过程通过富有想象力与探索性的遥操作范式,主动引导机器人与海量环境物体进行交互,涵盖多样的材质、复杂的几何形态以及独特的机械结构。

Heart Of Embodied AI
100%真实场景
构建高保真的物理交互数据”
数据集显式记录了真实世界发生的大量不完美行为与长尾情景——例如抓取失败、意外碰撞、物体掉落以及液体飞溅,以此勾勒出物理智能最真实的底色。一次抓取失败,能够暴露接触点、摩擦力、物体重心与执行误差之间的关系;一次滑落,能够呈现材料、形状与夹持策略之间的复杂耦合;一次碰撞,则可能让模型学习到力、空间位置与物体运动之间的真实反馈。
更重要的是,AGIBOT WORLD 2026所有数据均在100%真实场景中采集,在接触动力学、材料形变、多模态反馈等方面呈现出极高的物理保真度。这类数据在行业中极其稀缺,却是推动世界模型、神经仿真器、物理感知以及表征学习继续向前发展的关键基础。

Heart Of Embodied AI
为什么失败数据和多样交互数据
如此重要?
近期多项世界模型与机器人策略评估相关的前沿研究,都在从不同角度指向同一个问题:缺少足够丰富的动作分布、失败数据和接触交互数据,正在限制世界模型对真实世界的物理过程模拟能力。
当模型只见过标准动作和成功示范,它往往容易停留在“成功状态拟合”阶段。面对少见动作、复杂接触和非理想情况时,模型就可能出现失真,难以准确预测真实世界中的失败分布与物理演化。
在策略评估中,这一问题也会进一步放大。由于模型无法充分生成真实环境中的细微失败情况,策略在模型中的成功率可能远高于真实环境中的表现,从而造成世界模型和真实世界之间策略迁移的偏差。
这些来自前沿研究的最新探索,都在传递一个信号:失败数据正在从“噪声”变成“资产”。
Heart Of Embodied AI
失败是物理规律显影的瞬间
智元自身的世界模型团队也在相关方向上进行了大量实验验证。
在智元世界模型仿真器 Genie Envisioner-Sim 2.0 的相关实验中,结果表明,多样交互数据与失败数据对于提升 Action-Conditioned World Model 的建模能力具有重要意义。相比只基于成功示范训练的模型,纳入更丰富的动作分布、接触过程和非理想交互结果的数据,有助于模型更准确地理解“动作如何改变世界”,并在未来状态预测中减少不符合物理规律的生成结果,也就是常说的模型幻觉。
这也进一步说明,失败数据和多样交互数据并不是一个“锦上添花”的数据主题,而是世界模型走向真实可用过程中必须补上的关键一环。
失败数据让模型看见接触、摩擦、重心、形变、扰动和反馈之间真实而复杂的关系。也正是在这些关系中,机器人开始理解世界。
Heart Of Embodied AI
从学习成功动作
到理解完整物理分布
本期“多样交互”数据集,是首次将具身智能的数据范式从“学习成功动作”推进到“理解完整的物理分布”。唯有汲取真实而丰富的交互数据,机器人才能洞悉物理世界的运行法则。
从成功到失败,从动作到反馈,从任务完成到世界理解,AGIBOT WORLD 2026 正在为下一代具身智能搭建一条更完整的数据路径。
世界模型想要理解世界,首先要见过真实世界丰富的物理交互。
随着本期数据的开源共享,世界模型终于迎来了专属于自己的数据集。

