技术栈
24年具身模型汇总
v_JULY_v
2 个月前
偏好对齐
·
grape
·
rlhf微调vla
·
机器人策略泛化
·
24年具身模型汇总
GRAPE——RLHF微调VLA模型:通过偏好对齐提升机器人策略的泛化能力(含24年具身模型汇总)
过去的这两年,工作之余,我狂写大模型与具身的文章,加之具身大火,每周都有各种朋友通过CSDN私我及我司「七月在线」寻求帮助/指导(当然,也欢迎各大开发团队与我司合作共同交付):