腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?

具身智能之心 2026-06-22 18:00

上周,腾讯混元开源了 Hy-Embodied-0.5-VLA。

腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?图1

代码、两个 checkpoint、2000 多小时真机数据,Apache-2.0,随便下,随便用。

光“大厂开源真机 VLA”这一条,就够刷屏了。

但真正值得盯的,不是它开源了一个 VLA——是开源包里,夹带了一个叫 FlowPRO 的东西。critic-free 的偏好优化,专门处理真机上的失败干预。

换句话说就是:腾讯不只给了你一个能干活的 VLA 底座,还顺手划了一条线——底座只是起点,真机上能自己试错、自己改,才是下一关。

这条线比模型本身更狠。

先把模型讲清楚。

架构三件套:MoT 骨干负责视觉语言编码,双塔 flow-matching 动作专家(370M 参数)生成连续动作,时空注意力记忆编码器压历史帧。flow matching 这条路,π0 验证过,把动作生成做平滑的主流打法。

成绩也摆得出来。RoboTwin 2.0 上 50 个任务,干净环境 90.9%,随机化 90.1%。真机在 Dobot、JAKA、Astribot 三种本体上跑双臂操作,跨本体迁移直接演示。delta-chunk 动作表示把动作和本体运动学解耦——这就是它能跨本体的原因。

结论很直接:一个 90% 成功率、跨本体的强 VLA,现在是免费的、可下载的。底座,不再是壁垒了。

问题来了:人人能下载同一个 90% 的 VLA,大家比什么?

HyVLA 自己给的答案,就在 FlowPRO 那一段。

这里有个事必须说透。开源给你的 VLA 底座,本质是模仿学习喂出来的:拿大量示范数据,让模型学着把“看到的”映射到“该做的”。这套打法的天花板是写死的——最多复刻示范,碰到没见过的情况就抓瞎。那 90%,换个场景可能直接掉到 60。

真机 RL 补的,就是这一层。

模仿学习教“照着做”,RL 才教“做对”——让机器人在真实环境里试错、拿反馈、自己把策略往上推。FlowPRO 处理“真机失败干预”,干的就是这件事。

腾讯的潜台词很清楚:底座我开源,但真正把模型从“能跑 demo”调到“真能用”的那段,是真机 RL。 这才是接下来的分水岭。

不是腾讯一家这么看。π0 到 π0.6 那条线,早就开始往 VLA 里加 RL 做后训练;HIL-SERL、LWD 这些今年最硬的真机成果,全是 RL 在真机上打出来的。真机 RL 已经从论文里的可选项,变成了工程上的必选项。

底座的时代在收尾,后训练的时代刚开场。这就引出一个尴尬的现实。

VLA 底座有现成开源的了,可真机 RL 这段,没人能替你跑。而它恰恰是整条链路里最难自学的。

难在哪?真机 RL 本质不是算法问题,是系统工程问题。

采样慢且贵,试错一次可能撞坏硬件。跑一轮得有人把场景 reset。奖励函数稍微没设对,机器人就开始钻空子。仿真里不会出现的 sim2real 坑,真机上排着队等你踩。

结果就是大多数人的状态:仿真里 RL 跑得飞起,一上真机全线失灵。卡在“只能看,不能做”。

而如果你缺的正是这一段,那么我们具身智能之心开发的VLA+RL 真机实战课正好可以补齐。

如果你已经有真机环境、在产线上跑 RL,这门课偏基础,可以不看。但如果你正卡在“VLA 会调、真机 RL 上不去”这条线上,它可能正好是你缺的那块。

腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?图2
添加小助理咨询

我们提供了从硬件到算法、真机操作上的拆解:

  • 硬件组装:配套SOARM-101机械臂(主臂+从臂),从0带你组装;
  • 算法全拆解:从MDP、策略梯度到PPO/GRPO/DPO,5+主流RL算法,深度适配VLA场景;
  • PI系列深度解析:基于Physical Intelligence的模型演进路线(π0 → π0.6),分析架构优化方向;
  • 真机实操闭环:HIL-SERL算法、PI系列真机RL训练部署,全流程带练;
  • 简历指导:拆 10+ 头部企业 RL/VLA 岗位需求,配 1 次简历指导

学完你手里有的,是一个能写进简历、能拿去面试的真机项目——不是又一个仿真 demo。

适合谁:

  • 正在具身领域求职,需要实战项目;
  • VLA和RL方向想入门/进阶的同学;
  • 想做真机强化但不知道从哪下手;

具身智能之心的出发点是希望帮大家节省踩坑的时间、搞懂真机强化的细节,提供系统性项目学习的机会。帮助大家从0-1构建VLA+RL技术栈,特别是目前主流的pi0.6系列,把卡点和常见的坑逐一拆解。

课程大纲一览

腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?图3

内部交流讨论

腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?图4
腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?图5
腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?图6

pi0.6的demo一览

主讲老师

温兴男,哈工大博士,慕尼黑工大、中科院自动化所访问学者、前华为具身智能技术专家,具身智能之心教育板块负责人。

课程亮点

✅ 补全系统知识体系,解决理论断层 从MDP和策略梯度,到PPO/GRPO/DPO等5+主流RL算法全拆解,深度适配VLA场景;

✅深度解析PI0~PI07架构演进

基于Physical Intelligence公司的模型演进路线,分析模型架构优化方向,助理学员与业界前沿的研究成果并肩;

✅ 跑通真机RL闭环,解决实操卡壳

针对SOARM-101机械臂,从硬件组装、数据采集,到HIL-SERL算法实操、PI系列模型真机RL训练部署,全流程带练,真机落地细节、调优经验完整交付,克服真机实操空白的学员难题。

✅ 打通求职全链路,解决路径模糊

深度拆解10+头部机器人企业RL/VLA岗位核心需求,配套1次专属简历指导,手把手教你将项目经验转化为简历核心亮点,精准匹配企业用人标准,打通从学习到offer的最后一公里。

硬件+多个实战

赠送一套完整的SO101机械臂(主臂+从臂),从0带你组装。仿真下的RL实战与主流真机实战算法(pi系列完整剖析)。

腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?图7

课程说明

目前正式开课了,群内火热答疑中。2个月结课,正在准备秋招、实习的同学抓紧了!

由于课程涉及硬件与在线视频,购买后不支持退款。

咨询我们

更多课程内容,欢迎添加小助理微信AIDriver005咨询,也欢迎扫码学习~

腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?图8
添加小助理咨询
腾讯开源了HyVLA:当一个 90% 成功率的 VLA 可以随便下载,门槛到底在哪?图9
欢迎扫码学习课程

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
功率 开源
more
全球首条35微米功率半导体超薄晶圆工艺及封装测试生产线在上海建成
韩国投22.3亿元攻关下一代功率半导体
上海功率半导体企业赴港IPO:年入5亿,北汽上汽参投
K2 Space即将发射高功率卫星Gravitas,开启轨道数据中心技术验证
氮化镓功率器件,走向垂直结构
AI数据中心打开新场景,SiC/GaN功率器件走向系统级竞争
NVIDIA团队让编程Agent接管真实机器人实验,成功率达99%
散热之战:谁能掌握高功率AI服务器未来?
AI算力需求成核心驱动力!模拟芯片企业大功率电源收入增长210%
比肩存储,韩国盯上功率半导体
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号