技术栈

先回退 后纠正

v_JULY_v
6 小时前
rac·用于模仿学习的恢复与纠正方法·模仿学习中的误差累积·提升数据利用效率·先回退 后纠正·把衬衫挂到衣架上·打包外卖盒
RaC——挂衬衫且打包外卖盒:如果机器人将失败,则人类让其先回退后纠正,以减缓IL中的误差累积(让数据的增长对任务促进的效率更高)现代机器人模仿学习范式通过在大量人类演示数据上训练表现力强的策略架构然而,即使拥有成千上万的专家演示,在涉及丰富接触、可变形物体以及长时序任务上的表现仍远低于完美执行。这是由于现有基于人类远程操作的” 专家” 数据采集过程效率低下所致
我是有底线的