机器人是自动化的「最后一公里」
而灵巧手则是机器人的「最后一厘米」
阶段一:灵巧手机械结构与传感器基础(1个月)
学习目标:
• 了解灵巧手的分类、主流驱动结构及机械构型
• 掌握触觉传感器的种类及其应用方式
核心内容:
1. 灵巧手机械结构分类:
○ 绳驱结构(如 Shadow Hand,自由度最多)
○ 连杆传动(如 Robotiq 3-Finger)
○ 电机直驱(如 Allegro Hand,也多用于三指灵巧手的设计,如韩国TESOLLO,宇树Dex3-1等)
○ 柔性材料驱动(如气动手,形状记忆合金手等)
2. 触觉传感器分类与原理:
○ 视触觉(如 DIGIT、GelSight)
○ 磁感式(如 MAGNETO)
○ 压阻/电容式皮肤阵列(GitHub, Reddit)
推荐项目:
• Shadow Hand URDF模型:
○ shadow-robot/sr_common
• Allegro Hand ROS控制包:
○ simlabrobotics/allegro_hand_ros_v4
• DIGIT触觉传感器接口:
○ facebookresearch/digit-interface
• GelSight仿真环境:
○ danfergo/gelsight_simulation(GitHub, GitHub, GitHub)
阶段二:操作算法入门与模仿学习(1–2个月)
学习目标:
• 掌握模仿学习的核心技术及其在灵巧手任务中的应用
• 探索基于视频或遥操作数据的策略训练方法
核心内容:
1. 行为克隆(Behavior Cloning, BC)与DAgger
2. 基于视频的数据驱动方法(如 BC-Z)
3. 视觉语言动作大模型(如 π₀,DexVLG)(GitHub)
推荐项目:
• 基于模仿学习的灵巧操作技术综述:
○ Dexterous Manipulation through Imitation Learning:A Survey https://arxiv.org/html/2504.03515v3
• LeRobot多任务模仿学习框架:
○ huggingface/lerobot
• RoboMimic模仿学习平台:
○ ARISE-Initiative/robomimic
• BC-Z策略实现:
○ BC-Z/Bcz_policy
• π₀模型开源实现:
○ Physical-Intelligence/openpi(Hugging Face, GitHub)
• DexGraspVLA:迈向通用灵巧抓取的视觉—语言—动作框架:
○ 项目链接:https://github.com/Psi-Robot/DexGraspVLA
阶段三:强化学习基础与高维控制(1–2个月)
学习目标:
• 理解强化学习的核心理论,掌握基础算法
• 应用于高维动作空间的灵巧手控制
核心内容:
1. 马尔可夫决策过程(MDP)
2. 策略优化方法:REINFORCE、PPO、DQN、SAC、A2C
3. 经验回放与探索机制
推荐项目:
• Easy-RL中文教程:
○ datawhalechina/easy-rl
• 王树森强化学习课程资料:
○ wangshusen/DRL
• 60天强化学习挑战:
○ MLEveryday/60_Days_RL_Challenge
• Morvan Zhou强化学习入门教程:
○ MorvanZhou/Reinforcement-learning-with-tensorflow
• DI-engine强化学习框架:
○ opendilab/DI-engine
• DexSinGrasp:基于强化学习实现物体分离与抓取统一策略:
○ 项目链接:https://github.com/davidlxu/DexSinGrasp
阶段四:数据采集系统与遥操作(1个月)
学习目标:
• 构建低成本高精度的遥操作数据采集系统
• 支持灵巧手的数据集采集需求
核心内容:
1. VR手柄配套系统
2. 数据手套(如 Manus、Hi5)数据映射与存储
3. ROS驱动数据采集与回放
推荐项目:
• TCDM-VR数据采集系统:
○ tcdm-vr/tcdm-vr
• 外骨骼手套控制:
○ AirGesture/exo-hand
• DexWild数据采集系统(卡耐基梅隆大学):
○ 项目链接:https://dexwild.github.io/
阶段五:仿真平台部署与Sim2Real迁移(1–2个月)
学习目标:
• 在仿真环境中部署灵巧手策略
• 完成Sim2Real策略迁移
核心内容:
1. Mujoco平台部署与测试
2. Domain Randomization、视觉Sim2Real、动力学微调
3. 安全强化学习与多模态迁移策略(触觉 + 视觉)
推荐项目:
• DAPG灵巧手训练:
○ aravindr93/DAPG
• Diffusion Policy for Dexterous Hand:
○ Columbia-DexterousManipulation/Diffusion-Policy
• Shadow Hand在Isaac Gym中的实现:
○ NVIDIA-Omniverse/IsaacGymEnvs
• TCDM灵巧手Benchmark:
○ tcdm-vr/tcdm-benchmark
• Humanoid-Gym人形机器人迁移:
○ roboterax/humanoid-gym(diff-control.github.io)

