上交最新 | Interleave-VLA：首个支持交错图文指令的VLA框架

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

3D视觉工坊很荣幸邀请到了上海交通大学范存心，为大家着重分享他们团队的工作。如果您有相关工作需要分享，欢迎文末联系我们。

资讯配图 Interleave-VLA: Enhancing Robot Manipulation with Interleaved Image-Text Instructions
论文：https://arxiv.org/abs/2505.02152

直播信息

时间

2025年08月29日(周五)19：00

主题

上交最新 | Interleave-VLA：首个支持交错图文指令的VLA框架

直播平台

3D视觉工坊视频号

点击下方按钮预约直播

3D视觉工坊哔哩哔哩将同步直播

范存心
上海交通大学在读本科生

上海交通大学本科生，与严骏驰教授、丁明宇教授、杨学教授和贾萧松教授合作展开研究。研究方向为具身智能与自动驾驶的感知决策，聚焦于 VLM/VLA 的多模态学习。多篇研究成果曾发表在 ICML, NeurIPS, ICRA 等会议上。

注：3D视觉工坊很荣幸邀请到了上海交通大学范存心，为大家着重分享他们团队的工作。如果您有相关工作需要分享，欢迎联系微信：cv3d009，请备注：宣传工作，则不予通过。