
因为公众号平台更改了推送规则。记得点右下角的大拇指“赞”和红心“推荐”。这样每次新文章推送,就会第一时间出现在订阅号列表里。
来自不同学科的多个框架正汇聚于一个科学问题:一套智能系统究竟需要具备何种能力,才能不只是对世界进行预测、仿真与逻辑推理,更能在真实物理环境中完成实体行动、展现智能行为。

当代AI已彻底改变了科学技术,机器学习,尤其是深度神经网络的进步,使得其在众多领域中得以广泛应用。然而,尽管在语言、视觉和基础模型方面取得了建模世界的能力,但开发出能够在其中稳健感知、有效行动并适应的系统,仍是一个尚未解决的挑战。
几乎所有的AI都运行在数字虚拟空间,与现实世界保持了某种距离。其结果是期望与能力之间产生了不对称性。尽管人们经常谈论AGI,但商业机器人系统在执行一些相对简单的任务时仍面临困难,例如应对现实中形态各异的普通房门并顺利开启。Moravec悖论依然成立:人类认为需要大量认知努力的抽象推理过程,往往比人类能够轻松完成的感知运动技能更容易被机器实现。
物理世界会从多个维度改变智能问题的底层逻辑。例如,图像和视频等视觉数据相对丰富且易于获取,尤其适用于对象分类或人脸识别等特定任务。但与标签相对固定的图像分析任务不同,物理交互本质上具有不确定性。同样的现实情境可能导致不同反应,甚至来自同一个体的反应也各不相同,而且在复杂或动态环境中,往往没有单一的“正确”动作可供学习。因此,捕捉物理交互的数据更难获得,耗时更长,使得机器学习稳健的现实行为变得更加困难。
我们之所以缺少适配的数据,部分原因在于承认我们尚未理解当身体、环境与行为相互作用时,究竟需要测量什么。来自世界模型、具身智能、生态心理学与神经科学,以及物理AI和机器人学等不同方向的多个框架,已开始在这一挑战上趋同发展。尽管这些方法并未使用相同的术语,但它们都涉及主体性、具身性以及感知与行动之间关系的问题。
世界模型的概念可追溯至苏格兰心理学家和哲学家Kenneth Craik。他于1943年提出,生物体若能同时维持一个“微观世界模型”以及自身可能行动的表征,就能更有效地运作。这一直觉构成了当前AI领域中该术语广泛应用的基础,其中世界模型通常被理解为能够支持预测、规划和评估行为的内在表征。目前的研究方法侧重不同方面:一些研究强调物理世界模型,以捕捉环境中的物体及其动态特性;而另一些则聚焦于心理世界模型,用于表示人类情境中的目标与社会互动等要素。
具身智能则转换了研究重心。该理论认为,智能并非脱离躯体、纯粹抽象的计算过程;恰恰相反,躯体有助于决定主体能够感知、学习和执行什么。近年来神经AI领域的研究进一步强调了这一点,指出具身性并非智能与大脑功能的附属部分,而是其结构的一部分。正如华盛顿大学神经科学教授Bing Brunton在2026年COSYNE会议上所强调的那样,大脑无法脱离躯体感知世界、作用于世界。因此,任何关于智能行为的模型都必须包含神经系统、外部环境,以及介于两者之间的躯体。
生态心理学与生态神经科学将关注点从生物如何感知世界,转向它们如何感知世界所提供的行动可能性。根据20世纪中叶美国心理学家James J. Gibson的理论,affordance是指躯体、环境与任务之间关系所产生的可操作性机会。以门把手为例,人类能直接感知到它 “可抓握”,这种行动可能性直观显现,无需先推导门把手的抽象含义。《自然机器智能》2019年的一篇新闻特写指出,这一观点可能促使机器人技术不再依赖于对世界的详细重建,转而优先还原日常环境中可交互的结构。更广泛地说,这种视角为感知、行为与环境之间的联系提供了新路径,而不会将智能简单地归结为内部表征或仅仅是反应。
近期关于“物理AI”的讨论,将这种向具身性与使用可能性的研究思路落地为工程实践。重点不仅在于将AI嵌入机器之中,更在于认识到感知、形态、材料和控制等因素共同促成了适应性行为。从这一观点来看,智能并非仅限于软件,而部分体现在材料、形态和力学之中。

这些相互交叠的研究方法共同指向一个科学问题:一个系统要在世界中表现出智能行为,需要具备哪些条件。它们在所强调的关键要素上有所不同——一些研究侧重于内在的预测性结构,另一些则关注具身性、感觉运动耦合或affordance,还有一些将智能的某些方面归因于材料、形态和力学结构。这些差异具有积极意义,因为它们能够深化科学问题,并有助于指导研究进展。
机器人学是系统在物理世界中实时产生影响的领域,因此成为检验关于世界模型、具身性、可用性以及物理AI各种主张的试验场。它也支持诸如具身图灵测试等设想,该测试的问题不再是机器能否令人信服地模仿人类对话,而是它是否能在现实环境中获取并执行熟练的动作。AI的下一阶段,或许不再主要由对世界的更好描述或预测来定义,而更多体现在其在现实中日益增强的行动能力上。
原文链接:
高端微信群介绍 | |
创业投资群 | AI、IOT、芯片创始人、投资人、分析师、券商 |
闪存群 | 覆盖5000多位全球华人闪存、存储芯片精英 |
云计算群 | 全闪存、软件定义存储SDS、超融合等公有云和私有云讨论 |
AI芯片群 | 讨论AI芯片和GPU、FPGA、CPU异构计算 |
5G群 | 物联网、5G芯片讨论 |
第三代半导体群 | 氮化镓、碳化硅等化合物半导体讨论 |
存储芯片群 | DRAM、NAND、3D XPoint等各类存储介质和主控讨论 |
汽车电子群 | MCU、电源、传感器等汽车电子讨论 |
光电器件群 | 光通信、激光器、ToF、AR、VCSEL等光电器件讨论 |
渠道群 | 存储和芯片产品报价、行情、渠道、供应链 |

< 长按识别二维码添加好友 >
加入上述群聊

带你走进万物存储、万物智能、
万物互联信息革命新时代
