从具身智能到物理AI!

SSDFans 2026-06-23 08:06
从具身智能到物理AI!图1


点击蓝字
关注我们



因为公众号平台更改了推送规则。记得点下右下角的大拇指“赞”红心“推荐”。这样每次新文章推送,就会第一时间出现在订阅号列表里。

因为公众号平台更改了推送规则。记得点右下角的大拇指“赞”红心“推荐”。这样每次新文章推送,就会第一时间出现在订阅号列表里。


来自不同学科的多个框架正汇聚于一个科学问题:一套智能系统究竟需要具备何种能力,才能不只是对世界进行预测、仿真与逻辑推理,更能在真实物理环境中完成实体行动、展现智能行为。

从具身智能到物理AI!图2


当代AI已彻底改变了科学技术,机器学习,尤其是深度神经网络的进步,使得其在众多领域中得以广泛应用。然而,尽管在语言、视觉和基础模型方面取得了建模世界的能力,但开发出能够在其中稳健感知、有效行动并适应的系统,仍是一个尚未解决的挑战。

几乎所有的AI都运行在数字虚拟空间,与现实世界保持了某种距离。其结果是期望与能力之间产生了不对称性。尽管人们经常谈论AGI,但商业机器人系统在执行一些相对简单的任务时仍面临困难,例如应对现实中形态各异的普通房门并顺利开启。Moravec悖论依然成立:人类认为需要大量认知努力的抽象推理过程,往往比人类能够轻松完成的感知运动技能更容易被机器实现。

物理世界会从多个维度改变智能问题的底层逻辑。例如,图像和视频等视觉数据相对丰富且易于获取,尤其适用于对象分类或人脸识别等特定任务。但与标签相对固定的图像分析任务不同,物理交互本质上具有不确定性。同样的现实情境可能导致不同反应,甚至来自同一个体的反应也各不相同,而且在复杂或动态环境中,往往没有单一的“正确”动作可供学习。因此,捕捉物理交互的数据更难获得,耗时更长,使得机器学习稳健的现实行为变得更加困难。

我们之所以缺少适配的数据,部分原因在于承认我们尚未理解当身体、环境与行为相互作用时,究竟需要测量什么。来自世界模型、具身智能、生态心理学与神经科学,以及物理AI和机器人学等不同方向的多个框架,已开始在这一挑战上趋同发展。尽管这些方法并未使用相同的术语,但它们都涉及主体性、具身性以及感知与行动之间关系的问题。

世界模型的概念可追溯至苏格兰心理学家和哲学家Kenneth Craik。他于1943年提出,生物体若能同时维持一个“微观世界模型”以及自身可能行动的表征,就能更有效地运作。这一直觉构成了当前AI领域中该术语广泛应用的基础,其中世界模型通常被理解为能够支持预测、规划和评估行为的内在表征。目前的研究方法侧重不同方面:一些研究强调物理世界模型,以捕捉环境中的物体及其动态特性;而另一些则聚焦于心理世界模型,用于表示人类情境中的目标与社会互动等要素。

具身智能则转换了研究重心。该理论认为,智能并非脱离躯体、纯粹抽象的计算过程;恰恰相反,躯体有助于决定主体能够感知、学习和执行什么。近年来神经AI领域的研究进一步强调了这一点,指出具身性并非智能与大脑功能的附属部分,而是其结构的一部分。正如华盛顿大学神经科学教授Bing Brunton2026COSYNE会议上所强调的那样,大脑无法脱离躯体感知世界、作用于世界。因此,任何关于智能行为的模型都必须包含神经系统、外部环境,以及介于两者之间的躯体。

生态心理学与生态神经科学将关注点从生物如何感知世界,转向它们如何感知世界所提供的行动可能性。根据20世纪中叶美国心理学家James J. Gibson的理论,affordance是指躯体、环境与任务之间关系所产生的可操作性机会。以门把手为例,人类能直接感知到它 “可抓握”,这种行动可能性直观显现,无需先推导门把手的抽象含义。《自然机器智能》2019年的一篇新闻特写指出,这一观点可能促使机器人技术不再依赖于对世界的详细重建,转而优先还原日常环境中可交互的结构。更广泛地说,这种视角为感知、行为与环境之间的联系提供了新路径,而不会将智能简单地归结为内部表征或仅仅是反应。

近期关于“物理AI”的讨论,将这种向具身性与使用可能性的研究思路落地为工程实践。重点不仅在于将AI嵌入机器之中,更在于认识到感知、形态、材料和控制等因素共同促成了适应性行为。从这一观点来看,智能并非仅限于软件,而部分体现在材料、形态和力学之中。

从具身智能到物理AI!图3

这些相互交叠的研究方法共同指向一个科学问题:一个系统要在世界中表现出智能行为,需要具备哪些条件。它们在所强调的关键要素上有所不同——一些研究侧重于内在的预测性结构,另一些则关注具身性、感觉运动耦合或affordance,还有一些将智能的某些方面归因于材料、形态和力学结构。这些差异具有积极意义,因为它们能够深化科学问题,并有助于指导研究进展。

机器人学是系统在物理世界中实时产生影响的领域,因此成为检验关于世界模型、具身性、可用性以及物理AI各种主张的试验场。它也支持诸如具身图灵测试等设想,该测试的问题不再是机器能否令人信服地模仿人类对话,而是它是否能在现实环境中获取并执行熟练的动作。AI的下一阶段,或许不再主要由对世界的更好描述或预测来定义,而更多体现在其在现实中日益增强的行动能力上。



原文链接:

https://www.nature.com/articles/s42256-026-01239-3






高端微信群介绍

创业投资群


AI、IOT、芯片创始人、投资人、分析师、券商

闪存群


覆盖5000多位全球华人闪存、存储芯片精英

云计算群


全闪存、软件定义存储SDS、超融合等公有云和私有云讨论

AI芯片群


讨论AI芯片和GPU、FPGA、CPU异构计算

5G群


物联网、5G芯片讨论

第三代半导体群

氮化镓、碳化硅等化合物半导体讨论

储芯片群

DRAM、NAND、3D XPoint等各类存储介质和主控讨论

汽车电子群

MCU、电源、传感器等汽车电子讨论

光电器件群

光通信、激光器、ToF、AR、VCSEL等光电器件讨论

渠道群

存储和芯片产品报价、行情、渠道、供应链



从具身智能到物理AI!图4


< 长按识别二维码添加好友 >

加入上述群聊


从具身智能到物理AI!图5


长按并关注

带你走进万物存储、万物智能、

万物互联信息革命新时代

从具身智能到物理AI!图6
微信号:SSDFans



声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
刚刚,OpenAI 推出 Daybreak:要给全世界软件「打补丁」,一场 AI 攻防战
此芯科技首席市场官Danny Zhang:Agentic AI芯造不凡,以高性能智能体CPU赋能AGI发展|AgenticAICon 2026
战胜Mythos 5,OpenAI安全专用GPT-5.5-Cyber完全体来了
仅 16W 整机功耗:Fogwise® AIRbox Q900 运行 Stable Diffusion 的性能与画质表现
马云亲自下田插秧!阿里核心高管齐亮相,坐实AI长期深耕的决心
101亿!又一AI Infra独角兽拿下巨额融资
蔡崇信:阿里全面投入AI,全栈布局有巨大优势
44亿!AI芯片独角兽获新融资,核心团队快被老黄挖空了
ACL 2026论文作者来北京了:一次看懂AI前沿
实测微信 AI 助手“小微”,查账、分析朋友圈...12 个场景看懂它的能力和边界
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号