点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达
3D视觉工坊很荣幸邀请到了清华大学石昊,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎文末联系我们。
MemoryVLA: Perceptual-Cognitive Memory in Vision-Language-Action Models for Robotic Manipulation
论文:https://arxiv.org/abs/2508.19236
主页:https://shihao1895.github.io/MemoryVLA
直播信息
时间
2025年09月15日(周一)19:00
主题
MemoryVLA:机器人操作中视觉-语言-动作模型的感知-认知记忆
直播平台
3D视觉工坊视频号
点击按钮预约直播
3D视觉工坊哔哩哔哩也将同步直播
主讲嘉宾
石昊
清华大学自动化系硕士生
清华大学自动化系硕士生,旷视研究院联培,师从黄高老师和张祥雨老师,研究方向为具身智能,VLA,3D感知,曾获CVPR具身3D Visual Grounding竞赛冠军 & Innovation Award,在ICLR, NeurIPS等顶会发表多篇论文,担任ICLR,AAAI,ICCV等顶会审稿人。
直播大纲
机器人操作VLA中到底什么能力重要? 启发自人类记忆机理的MemoryVLA解决方案,实验结果。 从机器人操作任务本质出发,深入探讨为什么需要记忆。 对于VLA中记忆、推理的一些思考。
参与方式

注:3D视觉工坊很荣幸邀请到了清华大学石昊,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎联系微信:cv3d009
,请备注:宣传工作
,则不予通过。