点击下方卡片,关注“具身智能之心”公众号
2026 年过半。
回头看具身这条线,信息密度大得有点离谱。光是我们后台,几乎每天都有同学在问同一类问题:「VLA 和世界模型到底什么关系?」「真机 RL 该从哪入门?」「没有真机,这东西还能学吗?」
半年时间,这个方向的技术路线,迭代了几次。我们干脆盘一盘——这半年最值得补的几个方向,到底发生了什么,以及一个真想入局的人,该怎么补。
01
半年时间,具身的技术地基换了好几块
先把这半年最硬的几条线,一条条拎出来。
1)VLA 还在快速迭代,而且越来越「能动手」。
这半年 VLA 没降温,只是比拼的地方往后挪了。去年还在比「能不能端起一个杯子」,今年比的是同一个模型能不能跨任务、跨本体泛化,能不能在一长串动作里不崩、错了还能自己纠回来。
π0 到 π0.6 这条线最明显的变化,是开始往里加 RL 做后训练——光靠模仿学习喂示教,泛化是有天花板的,RL 负责把这层天花板再往上抬一截;再配上 flow matching 让动作更平滑、快慢双系统让它边想边做。
简单来说,VLA 还是那个「看懂画面 + 听懂指令 → 直接输出动作」的默认大脑,只是门槛已经从「跑通一个 demo」,抬到了「在真实场景里稳定干活」。

2)WM,从配角走到了台前。
过去 WM 大多只干两件事:生成训练数据、当离线仿真器,很少真正参与机器人的当下决策。今年这件事在变。我们前几天刚写过智源大会上星源智 ω-EVA 那篇——世界模型第一次走进机器人「出手前那一下」,实时修正动作。VLA 和 WM 怎么融合,成了今年上半年最热的叙事之一。

3)真机 RL,从可选项变成了必选项。
模仿学习有天花板:你示教得再多,模型也只是在「模仿」,碰到没见过的情况就抓瞎。真机 RL 补的就是这一块——让机器人在真实环境里试错、拿反馈、自己调。说白了,模仿学习教它「照着做」,RL 才教它「做对」。这条线今年明显从论文走向了工程刚需。
4)评测,正在悄悄变天。
具身这行有个老毛病:一个漂亮的 demo 视频,根本说明不了模型到底行不行。换个物体、换个光照、换个摆放,成功率可能就崩了。所以今年「怎么公平地考一个具身模型」本身成了硬课题——RoboArena 这类真实世界盲测榜单开始被当回事。
说白了,评测就是帮你分清「demo」和「deployment」的那把尺子。这条线看着不性感,却是判断一个模型有没有真本事的关键。
5)数据飞轮,依然是那个绕不开的胜负手。
模型是兵器,数据是粮草。真机数据怎么采得便宜、采得多、还能转起来,半年里依然是所有团队最头疼也最较劲的地方。
把这几条线连起来看会发现,它们不是孤立的:VLA 打底、RL 调优、WM 参与反馈、评测划定标准、数据飞轮供血——这套东西正在拧成一个整体。
这,就是这半年具身技术栈最大的变化。
02
可看得懂趋势,不等于上得了手
但趋势看得明白,是一回事;自己能不能上手,是另一回事。
这半年同学问我们最多的,其实不是「这是什么」,而是「我到底该从哪开始」。痛点很集中:
信息太碎。论文一天好几篇,名词一茬接一茬:retargeting、flow matching、credit assignment、embodiment gap……还没搞懂上一个,下一个又来了。
路径不清。尤其是小白和转行的同学,VLA、RL、WAM 摆在面前,不知道先学哪个、它们怎么衔接,很容易学一半就乱了。
真机门槛高。没有本体、没有数采环境,很多东西学了也跑不起来,卡在「只能看,不能做」。
RL 和数学劝退。强化学习这块,公式一上来就劝退一批人,折扣因子、credit assignment 这些点,自己啃特别费劲。
不会看评测、不会做科研。看不懂榜单背后的测试条件,容易被 demo 带跑;想发论文的同学,又常卡在选题、实验设计、怎么写,投出去石沉大海。
一句话:demo 和真正能上手之间,隔着一条不短的路。这条路,光靠刷论文、看 demo,很难自己走通。
03
我们正在做的,是把这条路理清楚
具身智能之心做的事,就一件:把这个方向正在发生的事讲准、讲透,再帮真想入局的人,把零散的知识连成一条能走的路径。
平时我们靠文章和社区做这件事。而系统补课这块,我们把课程也按上面这几条线铺齐了,正好对应这半年最该补的方向:
VLA / VLA+RL——从 VLA 主干到「VLA 怎么接 RL 调优」,对应第一、第三条线。
WAM 世界模型——把今年最热的 WAM 这条线讲明白,对应第二条线。
强化学习——把劝退人的 RL 基础和真机 RL,拆成能跟得上的节奏。
真机实战——解决「没环境、跑不起来」的痛点,也教你怎么读懂评测、不被 demo 带偏。
1v6 科研论文辅导——选题、实验、写作、投稿,一对六带着把论文做出来。
求职课程——把学到的东西,接到 offer 上。
......
这次 618,我们把上面这几条线对应的系统课,一起放了出来,优惠力度空前。

咨询和下单之前,有几句话再给大家下:
已经有真机环境、在跑 SOTA 的一线选手,这些课大概率偏基础,这笔钱可以省下。
卡在某一条线上的——RL 啃不动、真机跑不起来、论文投不出去——这次,是个补课的合适时机。
优惠时间不多了,都写在上面,大家可以按自己的节奏决定。
越往后,跟上的人和没跟上的人,差距会慢慢拉开。
想要入局从来不是「等全懂了再开始」,而是先找到一条能走的路,迈出第一步。