文/上海交通大学长聘教轨助理教授 穆尧
经授权发布
今天平安夜,弘扬老师机器人24小时叠衣服的直播,不仅是一次技术展示,更是一个对具身行业新一代模型研发和数采方案的范式重构信号。在感召之下,我重新审视了当下的技术路径,如果把目光投向即将到来的2026年,一个明显的趋势正在浮现:传统的“抓取-放置”任务作为学术研究的焦点将逐渐退潮,而“精细操作”将成为新的兵家必争之地。
1
任务演进:2026年的核心关注点
1. 抓放任务的“退潮” 说“过时”并不是说这类任务不重要。相反,目前VLA(Vision-Language Action)解决这类任务要到真正的“Solid”(坚固/鲁棒)程度,距离还是差很大。但这部分工作性质变了,它可能更多交给工业界来做迭代优化会更好一些,通过工程化手段解决Corner Case。
2. 真正的战场:精细操作(Fine Manipulation)。展望2026年,我会更关注的任务是精细操作。这类任务在PI06的demo上已经初见端倪,比如手机之类电子产品的出厂装盒、叠纸箱子、叠衣服。它们具有鲜明的特点:
-
颗粒度极细:每一步都很细,有严格的步骤和次序。
-
长时程:整体执行时间偏长。
-
极高的操作难度:以我们实验室目前集中活力在做的“机器人做化学实验”为例,这是我做过最hard的task了。面对复杂的物理交互,就连遥操,普通同学都搞不定。
2
数据价值重估:寻找“最金贵”的数据
精细操作蕴含着更丰富的知识,只有把这样的数据Scale Up(规模化)起来,才是非常有意义的。而在Scale Up的过程中,我们必须重新定义什么是“好数据”。
“二次尝试”的价值,特别是在精细操作的过程中,出现了一些环节尝试失败后的“二次尝试”数据,才是最为金贵的,也是最需要Scale Up的。
-
一气呵成的成功往往掩盖了容错的逻辑。
-
模型在失败后如何调整、如何纠错,这些数据中包含了对泛化性最有帮助的高维信息。
3
范式革新:打破“研究员vs数采员”的隔阂
这种对数据丰富性(特别是“二次尝试”数据)的高要求,直接引发了数采范式的革新。
1. 传统“任务书”模式的失效。我现在觉得,由研究人员写一份详细的采集任务书,交由数采员采集的方式,实际上很难采集到真正对泛化性有帮助的数据。
效率与质量的博弈:数采员往往希望以最快的效率完成采集任务(KPI导向),他们对于“二次尝试”这样数据的丰富性和必要性是很难保证的,往往会下意识规避失败。
2. 呼唤“同步迭代”的新模式。目前大多数厂家采用的严格分工明确的方式,可能不适用于新一代模型的研发。我们需要更灵活的机制:
-
训采同步:数采的同时,模型的训练要同步进行。
-
动态调整:要根据模型当下的表现来调整数采的需求和目标,灵活地调整数采任务书。
-
深度介入:这往往需要研究人员盯着数采员,甚至亲自下场界定数据的边界。
4
结语
新的数采和模型协同进化方案,我觉得是需要学术界和工业界协同思考和优化的。2026年的竞争,将不再是简单的抓取,而是谁能通过范式革新,在精细操作的Hard模式下,真正跑通数据与模型的闭环。
END