技术栈

机器人系鞋带

v_JULY_v
3 天前
gr-rl·分布式价值评估器·机器人系鞋带
GR-RL——首个让机器人系鞋带的VLA:先离线RL训练一个“分布式价值评估器”以做任务进度预测,后数据增强,最后在线RL随着大家(包括我司具身团队)在不断落地的过程中,越来越发现,在很多精细场景,或高精度场景下,单纯VLA的局限性越来越大
我是有底线的