MotrixArena S1 答疑直播第三场

原地抽搐？狗子倒着走？桥上绕不绕一圈？一次讲清！

MotrixArena S1 仿真强化学习挑战赛已经开赛，群内这几天问题密集爆发——

狗子原地抽搐、一动不动
训练过程中观测维度突然变成 1
render 重叠严重，看起来 10 只狗挤在一起
走到圆心还要不要停？
Stage 2 吊桥河床 60 分必须绕一圈吗？
倒着走算不算满分？
能不能用三个模型分别完成三个阶段？

为了让大家少踩坑、少走弯路，我们将举办一场 集中答疑直播专场，把这些核心问题系统讲清楚。

本场直播你将听到

一、Stage 2 到底能不能“分段训练”？

很多人关心：

S2 三段路能不能分三个文件写？

答案是：

地图必须是完整地图运行，但可以训练三个模型分别负责三个阶段，在统一地图中完成。

我们会讲清：

如何拆 reward
如何拆阶段策略
是否需要统一 observation
多模型切换的可行思路

二、狗子原地抽搐 / 一动不动怎么办？

群内最热问题：

训练时 render 看到狗在抽搐，但 reward 不低
设惩罚也没效果
是哪里出问题？

常见原因包括：

action scale 过大
reward 梯度冲突
观测 shape 错误
方向奖励设计错误
朝向目标用反向向量
接触力 threshold 不合理

我们会现场拆解一个“抽搐案例”：

如何用 print / tensor 检查 shape
如何定位观测维度变成 1 的问题
如何判断是 reward 问题还是控制问题

三、render 重叠到底是不是 bug？

很多同学看到：

10 只狗挤在一起
看着怪怪的
是不是环境出问题了？

其实：

每个 env 是独立碰撞
只是 render_spacing 导致视觉重叠
设置为 0 就会重叠到一起

我们会讲清：

num-envs 的正确理解
render_spacing 参数在哪
为什么重叠不影响训练

四、圆心必须停吗？倒着走算不算满分？

答：

必须停在圆心
只要达到条件，不设美观分
倒着走也可以满分

我们会讲清：

评分机制细则
越界判断逻辑
多次模拟如何累计分数

五、Stage 2 60 分路线规划到底怎么走？

大家问最多的一句：

吊桥河床这段必须绕一圈吗？

答案是：

是的，需要绕一圈
多次模拟累加分数
nav2section2 想拿 60 分必须完整完成路线

我们会详细拆解：

河床 + 吊桥任务结构
最高分获取逻辑
是否可以 shortcut
多次模拟如何优化稳定性

六、训练一次能不能继续训？

可以。

我们会讲：

如何继续加载已有 checkpoint
如何调整 learning rate 继续 refine
如何避免 catastrophic forgetting

直播时间

📍 MotrixArena S1 集中答疑专场

🕗 时间：2月13号晚上8点

🎥 形式：线上直播 + 实时互动答疑

这场直播适合谁？

想冲 Stage 2 高分的进阶选手

正在被 reward 折磨的开发者

想搞懂四足全地形控制逻辑的人

MotrixArena S1 不只是比赛

它是一次：

强化学习实战演练
四足控制系统理解
reward 设计能力提升
算法工程落地训练

我们希望：

大家不是“跑通一个 demo”，

而是真正理解“为什么狗会动”。

如果你已经遇到问题

欢迎在评论区留言，我们直播时优先解答。

MotrixArena S1

让我们在仿真世界打磨算法，

在真实世界验证能力。

—— Xbotics 具身智能社区