打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,
用心写好每一篇文章!
项目主页-https://huanngzh.github.io/VoxHammer-Page/
代码链接-https://github.com/Nelipot-Lee/VoxHammer
论文链接-https://arxiv.org/pdf/2508.19247

01-VoxHammer核心优势
VoxHammer是一种新的无需训练的3D编辑方法,它可以在3D潜在空间中进行精确和连贯的编辑。给定一个3D模型,VoxHammer首先预测其反转轨迹,并在每个时间步获得其反转延迟和键值标记。
随后,在去噪和编辑阶段,作者用相应的反转延迟和缓存的键值标记替换保留区域的去噪特征。通过保留这些上下文特征,这种方法确保了保留区域的一致重建和编辑部分的连贯集成。
为了评估保留区域的一致性,作者构建了Edit3D Bench,这是一个由数百个样本组成的人类注释数据集,每个样本都有精心标记的3D编辑区域。大量实验结果表明,VoxHammer在保留区域的3D一致性和整体质量方面明显优于现有方法。
02-VoxHammer落地场景
如上图所示,VoxHammer允许对3D资产上面的部件进行灵活的编辑。
03-VoxHammer上手指南
步骤1-创建一个3D掩码
步骤2-渲染RGB视角&掩码
python utils/render_rgb_and_mask.py \
--source_model assets/example/model.glb \
--mask_model assets/example/mask.glb \
--output_dir outputs
步骤3-对渲染视图进行上色
python utils/inpaint.py \
--image_path outputs/images/render_0002.png \
--mask_path outputs/images/mask_0002.png \
--output_dir outputs/images \
--prompt "A dog."
步骤4-运行3D编辑推理
python inference.py \
--input_model assets/example/model.glb \
--mask_model assets/example/mask.glb \
--image_dir outputs/images \
--output_dir outputs
04-VoxHammer性能评估


关注我,AI热点早知道,AI算法早精通,AI产品早上线!

禁止私自转载,需要转载请先征求我的同意!
欢迎你的加入,让我们一起交流、讨论与成长!