很高兴看到 SARM 现在已集成到 LeRobot 中! 这使得训练长时间、操作的奖励模型变得更加容易,并通过 RA-BC 改进策略。 非常感谢 LeRobot 团队的干净实现,以及我的合著者们的出色合作。