港科大(广州)最新开源 | ReconVLA:通过隐式视觉重建实现机器人精准感知与操作

3D视觉工坊 2025-08-27 07:00

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了香港科技大学(广州)IRPN实验室科研助理周子扬,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎文末联系我们。

资讯配图ReconVLA: Reconstructive Vision-Language-Action Model as Effective Robot Perceiver
论文https://arxiv.org/pdf/2508.10333.pdf
主页https://zionchow.github.io/ReconVLA/
代码https://github.com/Chowzy069/Reconvla

直播信息

时间

2025年08月27日(周三)19:00

主题

看准再出手!ReconVLA 用「视觉重构把 VLA 注意力拉回正轨

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

资讯配图

3D视觉工坊视频号也将同步直播

主讲嘉宾

周子扬
香港科技大学(广州)

香港科技大学(广州)IRPN实验室科研助理,导师李昊昂。

直播大纲

  1. 视觉语言模型简介
  2. 视觉语言动作模型现状分析
  3. ReconVLA方法简介及解析
  4. ReconVLA实验结果展示及分析

参与方式

资讯配图

3D视觉工坊很荣幸邀请到了香港科技大学(广州)IRPN实验室科研助理周子扬,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:宣传工作,则不予通过。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源 机器人
more
最强开源VLM“华山论剑”丨多模态专场直播
盘古大模型等部门被裁撤;马斯克刚刚开源 Grok 2.5;法裔女CEO接管OpenAI,奥特曼退居幕后?| AI 周报
字节开源Seed-OSS-36B模型,512k上下文
【他山之石】ICCV 2025 | ECD:高质量合成图表数据集,提升开源MLLM图表理解能力
开源复现o3图像思考!快手让AI不再被动看图,模型自主生成代码调用工具
全球开源大模型,前十五名全是中国的
港科大(广州)最新开源 | ReconVLA:通过隐式视觉重建实现机器人精准感知与操作
Chain-of-Agents: OPPO推出通用智能体模型新范式,多榜单SOTA,模型代码数据全开源
ICCV'25开源 | 无需任何标注!NVIDIA新作LongSplat:从任意拍摄的长视频重建3D高斯!
小米YU7遭逆行水泥罐车撞击,车主平安;马斯克开源Grok 2.5模型;黑悟空因未公布新DLC遭玩家刷差评 | 极客早知道
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号