上半年具身信息量太大了,WAM、VLA、真机RL这些该补的方向,我们盘齐了。

具身智能之心 2026-06-15 20:30

点击下方卡片,关注“具身智能之心”公众号


2026 年过半。

回头看具身这条线,信息密度大得有点离谱。光是我们后台,几乎每天都有同学在问同一类问题:「VLA 和世界模型到底什么关系?」「真机 RL 该从哪入门?」「没有真机,这东西还能学吗?

半年时间,这个方向的技术路线,迭代了几次。我们干脆盘一盘——这半年最值得补的几个方向,到底发生了什么,以及一个真想入局的人,该怎么补。

01

半年时间,具身的技术地基换了好几块

先把这半年最硬的几条线,一条条拎出来。

1)VLA 还在快速迭代,而且越来越「能动手」。

这半年 VLA 没降温,只是比拼的地方往后挪了。去年还在比「能不能端起一个杯子」,今年比的是同一个模型能不能跨任务、跨本体泛化,能不能在一长串动作里不崩、错了还能自己纠回来。

π0 到 π0.6 这条线最明显的变化,是开始往里加 RL 做后训练——光靠模仿学习喂示教,泛化是有天花板的,RL 负责把这层天花板再往上抬一截;再配上 flow matching 让动作更平滑、快慢双系统让它边想边做。

简单来说,VLA 还是那个「看懂画面 + 听懂指令 → 直接输出动作」的默认大脑,只是门槛已经从「跑通一个 demo」,抬到了「在真实场景里稳定干活」。

上半年具身信息量太大了,WAM、VLA、真机RL这些该补的方向,我们盘齐了。图1

2)WM,从配角走到了台前。

过去 WM 大多只干两件事:生成训练数据、当离线仿真器,很少真正参与机器人的当下决策。今年这件事在变。我们前几天刚写过智源大会上星源智 ω-EVA 那篇——世界模型第一次走进机器人「出手前那一下」,实时修正动作。VLA 和 WM 怎么融合,成了今年上半年最热的叙事之一。

上半年具身信息量太大了,WAM、VLA、真机RL这些该补的方向,我们盘齐了。图2

3)真机 RL,从可选项变成了必选项。

模仿学习有天花板:你示教得再多,模型也只是在「模仿」,碰到没见过的情况就抓瞎。真机 RL 补的就是这一块——让机器人在真实环境里试错、拿反馈、自己调。说白了,模仿学习教它「照着做」,RL 才教它「做对」。这条线今年明显从论文走向了工程刚需。

4)评测,正在悄悄变天。

具身这行有个老毛病:一个漂亮的 demo 视频,根本说明不了模型到底行不行。换个物体、换个光照、换个摆放,成功率可能就崩了。所以今年「怎么公平地考一个具身模型」本身成了硬课题——RoboArena 这类真实世界盲测榜单开始被当回事。

说白了,评测就是帮你分清「demo」和「deployment」的那把尺子。这条线看着不性感,却是判断一个模型有没有真本事的关键。

5)数据飞轮,依然是那个绕不开的胜负手。

模型是兵器,数据是粮草。真机数据怎么采得便宜、采得多、还能转起来,半年里依然是所有团队最头疼也最较劲的地方。

把这几条线连起来看会发现,它们不是孤立的:VLA 打底、RL 调优、WM 参与反馈、评测划定标准、数据飞轮供血——这套东西正在拧成一个整体。

这,就是这半年具身技术栈最大的变化。

02

可看得懂趋势,不等于上得了手

但趋势看得明白,是一回事;自己能不能上手,是另一回事。

这半年同学问我们最多的,其实不是「这是什么」,而是「我到底该从哪开始」。痛点很集中:

  • 信息太碎。论文一天好几篇,名词一茬接一茬:retargeting、flow matching、credit assignment、embodiment gap……还没搞懂上一个,下一个又来了。

  • 路径不清。尤其是小白和转行的同学,VLA、RL、WAM 摆在面前,不知道先学哪个、它们怎么衔接,很容易学一半就乱了。

  • 真机门槛高。没有本体、没有数采环境,很多东西学了也跑不起来,卡在「只能看,不能做」。

  • RL 和数学劝退。强化学习这块,公式一上来就劝退一批人,折扣因子、credit assignment 这些点,自己啃特别费劲。

  • 不会看评测、不会做科研。看不懂榜单背后的测试条件,容易被 demo 带跑;想发论文的同学,又常卡在选题、实验设计、怎么写,投出去石沉大海。

一句话:demo 和真正能上手之间,隔着一条不短的路。这条路,光靠刷论文、看 demo,很难自己走通。

03

我们正在做的,是把这条路理清楚

具身智能之心做的事,就一件:把这个方向正在发生的事讲准、讲透,再帮真想入局的人,把零散的知识连成一条能走的路径。

平时我们靠文章和社区做这件事。而系统补课这块,我们把课程也按上面这几条线铺齐了,正好对应这半年最该补的方向:

  • VLA / VLA+RL——从 VLA 主干到「VLA 怎么接 RL 调优」,对应第一、第三条线。

  • WAM 世界模型——把今年最热的 WAM 这条线讲明白,对应第二条线。

  • 强化学习——把劝退人的 RL 基础和真机 RL,拆成能跟得上的节奏。

  • 真机实战——解决「没环境、跑不起来」的痛点,也教你怎么读懂评测、不被 demo 带偏。

  • 1v6 科研论文辅导——选题、实验、写作、投稿,一对六带着把论文做出来。

  • 求职课程——把学到的东西,接到 offer 上。

  • ......

这次 618,我们把上面这几条线对应的系统课,一起放了出来,优惠力度空前。

上半年具身信息量太大了,WAM、VLA、真机RL这些该补的方向,我们盘齐了。图3

咨询和下单之前,有几句话再给大家下:

  • 已经有真机环境、在跑 SOTA 的一线选手,这些课大概率偏基础,这笔钱可以省下。

  • 卡在某一条线上的——RL 啃不动、真机跑不起来、论文投不出去——这次,是个补课的合适时机。

  • 优惠时间不多了,都写在上面,大家可以按自己的节奏决定。

越往后,跟上的人和没跟上的人,差距会慢慢拉开。

想要入局从来不是「等全懂了再开始」,而是先找到一条能走的路,迈出第一步。


END

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
实测「微信小微」:当腾讯开始兑现国民 App 的 AI 潜能
尴尬了!OpenAI刚派GPT-5.5-Cyber修补地球,Codex却爆出致命bug
实测微信 AI 助手“小微”,查账、分析朋友圈...12 个场景看懂它的能力和边界
死磕完几十个一线案例,我们对AI怎么落地营销服有了这些判断
57场面试杀进OpenAI!华人博士开源「AI面经」,含泪推荐
嵌入式专用的 AI 代码审查 Checklist
AI狂飙 血洗2.1万人!甲骨文13%岗位被裁
CXL:破解AI算力内存瓶颈的关键路径
出资额80亿,北京经开区成立AI与集成电路产业基金
从智算中心到Token工厂:RISMA智算云平台重构AI算力生产体系
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号