清华最新 | MemoryVLA：机器人操作中视觉-语言-动作模型的感知-认知记忆

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

3D视觉工坊很荣幸邀请到了清华大学石昊，为大家着重分享他们团队的工作。如果您有相关工作需要分享，欢迎文末联系我们。

资讯配图 MemoryVLA: Perceptual-Cognitive Memory in Vision-Language-Action Models for Robotic Manipulation
论文：https://arxiv.org/abs/2508.19236
主页：https://shihao1895.github.io/MemoryVLA

直播信息

时间

2025年09月15日(周一)19：00

主题

MemoryVLA：机器人操作中视觉-语言-动作模型的感知-认知记忆

直播平台

3D视觉工坊视频号

点击按钮预约直播

3D视觉工坊哔哩哔哩也将同步直播资讯配图

主讲嘉宾

石昊
清华大学自动化系硕士生

清华大学自动化系硕士生，旷视研究院联培，师从黄高老师和张祥雨老师，研究方向为具身智能，VLA，3D感知，曾获CVPR具身3D Visual Grounding竞赛冠军 & Innovation Award，在ICLR, NeurIPS等顶会发表多篇论文，担任ICLR，AAAI，ICCV等顶会审稿人。

直播大纲

机器人操作VLA中到底什么能力重要?
启发自人类记忆机理的MemoryVLA解决方案，实验结果。
从机器人操作任务本质出发，深入探讨为什么需要记忆。
对于VLA中记忆、推理的一些思考。

参与方式

注：3D视觉工坊很荣幸邀请到了清华大学石昊，为大家着重分享他们团队的工作。如果您有相关工作需要分享，欢迎联系微信：cv3d009，请备注：宣传工作，则不予通过。