点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达
来源:3D视觉工坊
「3D视觉从入门到精通」知识星球(点开有惊喜) !星球内新增20多门3D视觉系统课程、入门环境配置教程、多场顶会直播、顶会论文最新解读、3D视觉算法源码、求职招聘等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!

RGBTrack: Fast, Robust Depth-Free 6D Pose Estimation and Tracking 作者:Teng Guo, Jingjin Yu
单位:新泽西州立大学
paper:https://arxiv.org/pdf/2506.17119
代码:GitHub - GreatenAnoymous/EnhancedFoundationPose
贡献:
我们提出了一种鲁棒性框架RGBTRACK,用于基于纯RGB数据进行实时6D位姿估计与跟踪,从而消除了此类动态且高精度物体位姿跟踪任务对深度输入的需求。
基于FoundationPose架构,我们设计了一种创新的二分搜索策略,结合渲染对比机制,能够高效地推断深度并从真实比例的CAD模型中生成稳健的位姿假设。
为在包含快速运动和遮挡的动态场景中保持稳定跟踪,RGBTrack将前沿的2D物体跟踪技术(XMem)与卡尔曼滤波器及状态机相结合,实现主动物体位姿恢复。
此外,RGBTrack的尺度恢复模块利用初始深度估计动态调整未知比例的CAD模型,使其能够与现代生成式重建技术无缝集成。
实验:
在基准数据集上的广泛评估表明,RGBTrack创新的免深度方法实现了具有竞争力的精度和实时性能,使其成为机器人、增强现实、计算机视觉等应用领域极具潜力的实用解决方案。
