还原Physical AI的全貌!首个聚焦物理交互的具身数据集开源了~

具身智能之心 2026-06-03 17:00

点击下方卡片,关注“具身智能之心”公众号

近日,智元自研的世界模型 Genie Envisioner-Sim 2.0(GE-2.0)登顶 WorldArena Challenge榜单,获得总冠军。值得关注的是,GE-2.0通过引入多样交互数据进行训练,进一步提升了世界模型对真实物理世界的建模能力。

所谓多样交互数据,往往是我们早已习惯的生活中的一些瞬间:碗放入水槽,水面会泛起一圈圈涟漪;乒乓球落地,会一次次弹起;塑料袋从空中掉落,会轻轻飘下。

对于人类来说,这些都是习以为常的经验。但对于机器人来说,它们正是理解物理世界最困难、也最关键的部分。这也是世界模型研究中的关键需求:机器人对世界的建模和预测需要真实丰富的交互数据,才能更好地理解物理世界的运行。

世界模型一直都缺少一批真正属于它的数据。

今天,智元开源AGIBOT WORLD 2026数据集主题二:“多样交互(Rich Interaction)”,旨在填补这一空白。这是行业首个聚焦物理交互的开源具身数据集,数据集不仅记录预期内的成功,更致力于捕捉机器人与真实世界之间那些多样、精细且充满接触的物理对话,以此还原物理智能的全貌。

  • 项目主页:agibot-world.com

  • 开源地址:huggingface.co/datasets/agibot-world/AgiBotWorld2026



点击阅读原文,跳转至项目主页

四月智元AI发布周首日,开源了数据集第一期“模仿学习”主题,此次的主题二“多样交互”则进一步走向机器人与真实物理世界之间更复杂、更高密度、更具不确定性的“交互学习”。

过去,具身数据集往往强调“专家示范”,可真实世界并不总是理想、可控的。机器人真正理解物理世界,不仅需要学习如何完成任务,也需要理解非理想情况背后的物理规律。

本期数据集突破了数据采集中仅关注成功案例的局限,直面现实物理世界中微妙的复杂性,捕捉“意料之外”的价值。采集过程通过富有想象力与探索性的遥操作范式,主动引导机器人与海量环境物体进行交互,涵盖多样的材质、复杂的几何形态以及独特的机械结构。

还原Physical AI的全貌!首个聚焦物理交互的具身数据集开源了~图1




Heart Of Embodied AI

100%真实场景

构建高保真的物理交互数据




数据集显式记录了真实世界发生的大量不完美行为与长尾情景——例如抓取失败、意外碰撞、物体掉落以及液体飞溅,以此勾勒出物理智能最真实的底色。一次抓取失败,能够暴露接触点、摩擦力、物体重心与执行误差之间的关系;一次滑落,能够呈现材料、形状与夹持策略之间的复杂耦合;一次碰撞,则可能让模型学习到力、空间位置与物体运动之间的真实反馈。

更重要的是,AGIBOT WORLD 2026所有数据均在100%真实场景中采集,在接触动力学、材料形变、多模态反馈等方面呈现出极高的物理保真度。这类数据在行业中极其稀缺,却是推动世界模型、神经仿真器、物理感知以及表征学习继续向前发展的关键基础。

还原Physical AI的全貌!首个聚焦物理交互的具身数据集开源了~图2




Heart Of Embodied AI

为什么失败数据和多样交互数据

如此重要?




近期多项世界模型与机器人策略评估相关的前沿研究,都在从不同角度指向同一个问题:缺少足够丰富的动作分布、失败数据和接触交互数据,正在限制世界模型对真实世界的物理过程模拟能力。

当模型只见过标准动作和成功示范,它往往容易停留在“成功状态拟合”阶段。面对少见动作、复杂接触和非理想情况时,模型就可能出现失真,难以准确预测真实世界中的失败分布与物理演化。

在策略评估中,这一问题也会进一步放大。由于模型无法充分生成真实环境中的细微失败情况,策略在模型中的成功率可能远高于真实环境中的表现,从而造成世界模型和真实世界之间策略迁移的偏差。

这些来自前沿研究的最新探索,都在传递一个信号:失败数据正在从“噪声”变成“资产”。




Heart Of Embodied AI

失败是物理规律显影的瞬间




智元自身的世界模型团队也在相关方向上进行了大量实验验证。

在智元世界模型仿真器 Genie Envisioner-Sim 2.0 的相关实验中,结果表明,多样交互数据与失败数据对于提升 Action-Conditioned World Model 的建模能力具有重要意义。相比只基于成功示范训练的模型,纳入更丰富的动作分布、接触过程和非理想交互结果的数据,有助于模型更准确地理解“动作如何改变世界”,并在未来状态预测中减少不符合物理规律的生成结果,也就是常说的模型幻觉。

这也进一步说明,失败数据和多样交互数据并不是一个“锦上添花”的数据主题,而是世界模型走向真实可用过程中必须补上的关键一环。

失败数据让模型看见接触、摩擦、重心、形变、扰动和反馈之间真实而复杂的关系。也正是在这些关系中,机器人开始理解世界。



Heart Of Embodied AI

从学习成功动作

到理解完整物理分布




本期“多样交互”数据集,是首次将具身智能的数据范式从“学习成功动作”推进到“理解完整的物理分布”。唯有汲取真实而丰富的交互数据,机器人才能洞悉物理世界的运行法则。

从成功到失败,从动作到反馈,从任务完成到世界理解,AGIBOT WORLD 2026 正在为下一代具身智能搭建一条更完整的数据路径。

世界模型想要理解世界,首先要见过真实世界丰富的物理交互。

随着本期数据的开源共享,世界模型终于迎来了专属于自己的数据集。

还原Physical AI的全貌!首个聚焦物理交互的具身数据集开源了~图3


END

 推荐阅读 :

还原Physical AI的全貌!首个聚焦物理交互的具身数据集开源了~图4


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI IC 开源
more
英伟达力荐,小团队两个月开源一款「光速级」智能体推理引擎
【K230/K230D新技能点亮】有趣开源项目分享:CanMV 解锁 AI 代码生成 + 硬件控制全新体验
阿波罗11号登月代码开源,NASA公开57年前关键程序细节
从“卷模型”到“拼数据”,昂贵数采下的15个开源项目
Anthropic一发布Multica就开源,这个4人团队想抢占AI协作层
超睿科技入选OpenHarmony + RISC-V 工作组首批共建单位:以高性能算力赋能开源生态新未来
小龙虾彻底凉了?清华团队连夜开源Agent神器,Token成本狂降70%!
小米MiMo-V2.5开源在即,国产AI从追赶迈向领跑新阶段
多模态模型终于不用「抽帧看世界」?LLaVA-OneVision-2.0全开源全帧率技术解读
黄仁勋率先开源量子AI大模型
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号