上交最新 | Interleave-VLA:首个支持交错图文指令的VLA框架

3D视觉工坊 2025-08-29 07:00

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了上海交通大学范存心,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎文末联系我们。

资讯配图Interleave-VLA: Enhancing Robot Manipulation with Interleaved Image-Text Instructions
论文https://arxiv.org/abs/2505.02152

直播信息

时间

2025年08月29日(周五)19:00

主题

上交最新 | Interleave-VLA:首个支持交错图文指令的VLA框架

直播平台

3D视觉工坊视频号

点击下方按钮预约直播

3D视觉工坊哔哩哔哩将同步直播

资讯配图

主讲嘉宾

范存心
上海交通大学在读本科生

上海交通大学本科生,与严骏驰教授、丁明宇教授、杨学教授和贾萧松教授合作展开研究。研究方向为具身智能与自动驾驶的感知决策,聚焦于 VLM/VLA 的多模态学习。多篇研究成果曾发表在 ICML, NeurIPS, ICRA 等会议上。


直播大纲

  1. 图文交错指令的优势
  2. 让VLA理解图文交错指令:模型架构与数据集
  3. 仿真与真机操作任务评测展示

参与方式

资讯配图

:3D视觉工坊很荣幸邀请到了上海交通大学范存心,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:宣传工作,则不予通过。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号