人类行走时,下肢蹬地推进,上肢摆动平衡,躯干深层肌群维持脊柱稳定。这种全身协调看似简单,实则是神经系统与 600 余块骨骼肌精密配合的结果。然而,现有的肌肉骨骼模型(Musculoskeletal Model)大多停留在局部——或仅有上肢,或只有下肢,或躯干肌群残缺不全。更关键的是,即便有了模型,能同时控制 600 块以上肌肉生成合理运动的算法几乎空白。
这一空白直接限制了三类研究:理解人体运动控制的神经机制、设计人形机器人与假肢等交互设备、以及为具身智能提供真实的人体自我模型。
01. 三重难关
构建全身肌肉骨骼模型并驱动其运动,面临三重根本性困难。
第一,解剖学数据门槛。人体有 90 个刚性骨段、206 个关节,每块肌肉的附着点、质量分布、转动惯量等参数必须基于解剖学和生物力学数据精确设定。
第二,控制维度灾难。全身 700 个肌肉-肌腱单元(Muscle-Tendon Unit, MTU)协同驱动 206 个关节,动作空间极高维且冗余。传统的端到端(End-to-End, E2E)深度强化学习(Deep Reinforcement Learning, DRL)直接在 700 维肌肉兴奋空间搜索策略,模型往往在仿真中迅速崩溃。
第三,肌肉本身的非线性。骨骼肌并非简单的力矩马达。采用 Hill 型肌肉模型(Hill-Type Muscle Model)时,每块肌肉的力-长度、力-速度关系呈非线性,且激活与收缩存在 10 毫秒(ms)至 40 毫秒的时滞。这种非线性和时滞让控制信号难以精确映射到关节运动。
02. MS-HUMAN-700:补全全身的拼图
为了填补空白,清华大学眭亚楠等人构建并开源了 MS-HUMAN-700。这是一个全身肌肉骨骼模型,包含 90 个身体节段、206 个关节和 700 个肌肉-肌腱单元,覆盖躯干与四肢。
模型以骨盆为运动学树根,各骨段通过铰链关节(Hinge Joint)或滑动关节(Slide Joint)连接,运动范围由解剖学数据约束。对于腰大肌(Psoas Major)等大跨度肌肉,研究团队采用多路径点加包绕几何(Wrapping Geometry)建模,模拟骨骼和软组织对肌腱的物理约束。

图 1:MS-HUMAN-700 全身肌肉骨骼模型及其应用场景。

图 2:基于 TSHT 算法的 MS-HUMAN-700 行走学习过程。
整个模型可导入 MuJoCo 等开源物理引擎,支持接触交互仿真。相较于 OpenSim 平台,转换后的仿真速度提升两个数量级。
03. TSHT:在 700 维空间里找到捷径
面对 700 维动作空间,研究团队提出两阶段分层训练(Two-Stage Hierarchical Training, TSHT)算法。核心思想是:先用生理肌肉协同降低维度,再用低维表示进一步压缩,最后在压缩空间中学习策略。

图 3:腰大肌的多肌肉-肌腱单元与包绕几何建模。
第一阶段:采集阶段。智能体输出肌肉群动作,经肌肉协同函数映射为全身 700 维肌肉激活。此时引入运动捕捉数据作为参考轨迹,通过逆运动学重建关节角度,奖励函数同时追踪关节位置与速度。该阶段生成大量次优但可行的轨迹。
第二阶段:训练阶段。研究团队采用自编码器从次优轨迹中提取 50 维低维隐变量。智能体在隐空间中输出动作,经解码器还原为肌肉群动作,再经肌肉协同扩展为全身激活。策略优化采用软演员-评论家(SAC)算法,在最大化累积折扣回报的同时保持策略熵。
这种分层结构避免了端到端直接在 700 维空间搜索的困境。作为对比,团队也测试了基于主成分分析和独立成分分析的协同动作表示方法。

图 4:两阶段分层训练(TSHT)框架。
04. 从平地行走到穿戴假肢
研究团队在三个任务上验证了 MS-HUMAN-700 与 TSHT。
任务一:自然行走。模型需复现真实人体步行轨迹。奖励函数包含位置追踪、速度追踪和关键关节追踪三项,权重分别为 1、5×10^-3 和 1。
任务二:人机外骨骼交互。模型穿戴 MARCH 外骨骼行走,要求上肢跟踪参考轨迹,同时最小化腿部与绑带间的接触力。TSHT 在该任务回报达 986.91,E2E 与 SAR 均因高维控制失败而呈现负回报,分别为 -1111.48 和 -275.09。
任务三:假肢步行。模型右小腿与足部替换为假肢,右手持拐杖,模拟病理条件下的步态。该任务考验系统对外部扰动的抵抗能力。TSHT 回报 274.67,显著优于 E2E 的 101.24 和 SAR 的 54.83。
如图 5 所示,TSHT 在三项任务中均稳定收敛,而基线方法在训练阶段后期波动剧烈或陷入局部最优。

图 5:TSHT 与基线算法在三项任务中的性能对比。
05. 仿真与真实的对照
研究团队将仿真关节角度与运动捕捉参考数据、仿真肌肉激活与实验肌电图( EMG)信号进行了对比。
图 6c 显示,下肢髋屈曲(Hip Flexion)、膝角(Knee Angle)、踝角(Ankle Angle)曲线具有与参考数据一致的周期性。仿真与参考轨迹的偏差主要源于参考轨迹未考虑全身动力学平衡,智能体自发增加了髋屈曲和踝背屈(Dorsiflexion)角度以防止绊倒,这符合生物力学稳定策略。
图 6d 对比了 6 组代表性肌群——臀大肌(Gluteus Maximus)、臀中肌(Gluteus Medius)、股直肌(Rectus Femoris)、股外侧肌(Vastus Lateralis)、股二头肌(Biceps Femoris)、胫骨前肌(Tibialis Anterior)——的仿真激活与实验 EMG。两者在时间模式上吻合,尽管部分肌肉的激活时相和幅度存在差异。在所有肌肉上精确复现实测 EMG 活动仍是肌肉驱动仿真的核心挑战。

图 6:运动捕捉实验与仿真结果对比。
06. 未来:具身智能需要一具完整的身体
MS-HUMAN-700 与 TSHT 为全身肌肉骨骼控制提供了首个可扩展的仿真框架。人形机器人、外骨骼、假肢的设计者可以在此框架中预演人机交互;神经科学家可以借此推断运动控制的神经机制。
当然,该工作仍有局限。当前算法主要面向周期性步态,对于非周期性的复杂全身操作任务尚需扩展。此外,仿真与真实 EMG 的时相偏差表明,肌肉激活的精确建模仍有提升空间。研究团队下一步将优化数据收集效率,并向驱动器仿真与复杂动态接触扩展。
当数字人类真正拥有与自己解剖结构一致的 700 条肌肉与 206 个关节,具身智能的“身体”将不再是一个简化的质点或刚体,而是一个会代偿、会自适应的鲜活系统。这种基于全身肌肉骨骼的自我模型,或许正是机器理解人类运动智能的重要起点。
参考:C. Zuo, K. He, J. Shao and Y. Sui, "Self Model for Embodied Intelligence: Modeling Full-Body Human Musculoskeletal System and Locomotion Control with Hierarchical Low-Dimensional Representation," 2024 IEEE International Conference on Robotics and Automation (ICRA), Yokohama, Japan, 2024, pp. 13062-13069

脑机接口社区是国内首家脑机接口(BCI)产业服务平台。主要为企业、科研团队、投资机构和从业者提供以下服务:
宣传报道:图文、短视频、直播形式报道企业动态、技术解读、产品介绍等内容,提升曝光和行业影响力。
资源对接:根据需求匹配资本、供应链、临床机构、渠道方等资源,完成真实对接,促进合作。
成果转化:协助技术团队寻找产业方、投资人及落地场景,推动技术到产品的转化。
活动策划执行:承接线上线下路演、沙龙、论坛等活动的策划与执行。
其他定制需求:包括报告定制、市场调研、人才招聘支持等个性化服务。