为什么现在的很多工作都在机械臂VLA,包括头部几个大厂的工作,人形全身的VLA和移动操作的VLA,甚至说四足的VLA基本没啥很好的工作。why?
先分析下行业里面是怎么用VLA的?机械臂 VLA 目前主要应用于移动抓取和放置任务,这些任务相对单一且主要依赖视觉,辅以触觉或力觉传感器,容易落地。
人形机器人的数据采集困难、控制复杂度高(一只灵巧手可能有 20 个自由度,全身加起来接近百个自由度)。所以很多明星公司,都采用强化的方式去训练相关动作。by the way,人形 VLA 模型在应对这些复杂环境时,其泛化性和灵活性仍不足够,难以像机械臂 VLA 那样在相对结构化的环境中稳定工作。
maybe,最好的方式是VLA+RL结合。RL擅长底层运动优化,VLA擅长高层任务规划,未来很有可能形成“VLA规划+RL执行”的混合架构。这也是目前很多公司正在投入人力去突破的方向,看到陆续有许多独角兽公司陆续开放岗位,这个方向也比较靠谱。
如果您比较关注具身产业和职场圈子的那些事儿,欢迎添加具身智能之心专属职位分析师做进一步交流!

更多内容,也欢迎加入我们的具身智能之心知识星球,带你一起看行业!
