【通识】RSL-RL快速上手强烈推荐张老师系列:张伟楠老师的动手学强化学习- PPO 目前完成了基于宇树rl_lab的RL仿真训练复现,踩了一些比较低级错误的坑后,发现纯RL的效果比预期的要好,算是pipeline流程通了,开始了解实现原理。 在智驾中,RL也已经实现了量产落地,能够在专家数据基础上实现性能拓展,效果还是很显著的。 拿unitree_rl_lab作为学习入口: RSL-RL 做什么、PPO 和 Distillation 两条训练链路怎么跑、它如何接入 Unitree/Isaac Lab 任务,以及应该从哪些文件开始读