先回退后纠正

v_JULY_v

10 个月前

RaC——挂衬衫且打包外卖盒：如果机器人将失败，则人类让其先回退后纠正，以减缓IL中的误差累积(让数据的增长对任务促进的效率更高)现代机器人模仿学习范式通过在大量人类演示数据上训练表现力强的策略架构然而，即使拥有成千上万的专家演示，在涉及丰富接触、可变形物体以及长时序任务上的表现仍远低于完美执行。这是由于现有基于人类远程操作的” 专家” 数据采集过程效率低下所致

先回退 后纠正