Physical Intelligence发布π0.7模型，具身智能迈出通用化关键一步

【科技24时区】总部位于旧金山的机器人初创公司Physical Intelligence近日发布了一项突破性研究成果。这家成立仅两年、却已悄然成为硅谷最受关注的人工智能企业之一的公司，在4月16日公布的新论文中指出，其最新推出的π0.7模型已能指挥机器人完成从未接受过专门训练的任务——这一能力甚至令该公司自身研究人员感到意外。

该模型被Physical Intelligence描述为迈向“通用机器人大脑”目标的早期但具有实质意义的一步。所谓通用机器人大脑，即能够面对陌生任务，通过人类以自然语言进行引导后，成功执行操作。若研究结果经得起同行检验，则意味着机器人人工智能可能正迎来类似大语言模型（LLM）发展初期那样的拐点：其能力增长开始呈现出超越训练数据规模所能解释的“复合式跃升”。

论文的核心主张在于“组合泛化”（compositional generalization），即模型能将不同情境中学到的技能重新组合，用以解决全新问题。传统机器人训练方法多依赖“死记硬背”：针对每一项具体任务收集专用数据、训练专用模型，再重复此流程。而π0.7则打破了这一范式。公司联合创始人、加州大学伯克利分校教授Sergey Levine表示：“一旦模型跨越了只能做‘见过’任务的门槛，开始以新方式重组已有知识，其能力提升速度将远超线性增长。这种更优的扩展特性，我们在语言和视觉领域早已见证。”

研究中最引人注目的演示涉及一台在训练数据中几乎从未出现过的空气炸锅。团队回溯发现，整个训练集中仅有两个相关片段：一次是另一台机器人将炸锅盖推合，另一次来自开源数据集，显示某机器人按指令将塑料瓶放入炸锅内。然而，π0.7竟融合这些零散信息与大规模网络预训练知识，形成了对设备功能的有效理解。

在无任何指导的情况下，模型已能尝试使用该设备烤制红薯；而在研究人员以分步口头指令引导下（如同向新员工讲解操作流程），任务成功率显著提升。这一“可辅导性”至关重要——它意味着未来机器人可在新环境中部署，并通过实时语言交互持续优化，而无需额外采集数据或重新训练模型。

当然，研究团队对模型局限亦毫不回避。斯坦福大学计算机科学博士生、Physical Intelligence研究科学家Ashwin Balakrishna坦言，有时失败并非源于模型或机器人本身，而是“我们自己不会写提示词”。他举例称，早期空气炸锅实验成功率仅5%，但在花半小时优化指令表述后，成功率跃升至95%。

目前，π0.7尚无法仅凭单一高层指令（如“去给我做片吐司”）自主完成复杂多步骤任务。Levine强调：“但如果你一步步告诉它‘打开烤面包机这个部分、按下那个按钮、做这个动作’，它通常就能很好地完成。”此外，团队也承认，当前机器人领域缺乏统一基准测试标准，使得外部验证其成果存在困难。因此，他们选择将π0.7与其过往为特定任务定制的专家模型进行对比，结果显示：在制作咖啡、折叠衣物、组装纸箱等复杂任务上，通用模型性能已与专用系统相当。

若研究者所言属实，此项工作的真正意义或许不在于某个具体演示，而在于结果本身令深谙训练数据构成的研究人员感到“惊讶”。Balakrishna坦言：“我过去总能根据数据内容大致预测模型能力，很少被震撼。但最近几个月是我第一次真正感到意外——比如我随便买了套齿轮，问机器人‘你能转动这个齿轮吗？’结果它真的做到了。”

Levine则将此刻类比于当年GPT-2首次生成“安第斯山脉中的独角兽”故事时的震撼：“它从哪学来的秘鲁独角兽？如此奇怪的组合！而如今在机器人领域看到类似现象，实在特殊。”

当然，批评者会指出一个结构性不对称：语言模型拥有整个互联网作为学习素材，而机器人缺乏同等规模的真实物理交互数据，仅靠提示工程难以完全弥补。对此，Levine预判外界质疑或将聚焦于“任务过于平凡”——“机器人又没在翻跟头”。但他反驳道，真正重要的区别恰在于：精心编排的炫技表演 vs. 具备泛化能力的实用系统。后者虽不炫目，却更具现实价值。

值得注意的是，论文全文措辞极为谨慎，反复使用“早期迹象”“初步演示”等限定语。研究团队明确强调，这仍是科研成果，而非可商用产品。当被直接问及基于该技术的系统何时能投入现实应用时，Levine拒绝给出时间表：“有充分理由保持乐观，进展确实比我几年前预期快得多。但要回答这个问题，对我而言仍极其困难。”

据公开信息，Physical Intelligence迄今已融资超10亿美元，最新估值达56亿美元。其投资热潮很大程度上源于联合创始人Lachy Groom的背书，这位曾成功押注Figma、Notion、Ramp等明星项目的硅谷知名天使投资人，将Physical Intelligence视为自己长期寻觅的创业标的。这一背景使其即便拒绝提供商业化路线图，仍能吸引顶级机构资本。据悉，公司目前正洽谈新一轮融资，估值有望接近翻倍至110亿美元。对此，团队未予置评。