论文速读|I-CTRL:通过受限强化学习使人型机器人模仿和控制

论文地址:https://arxiv.org/pdf/2405.08726

I-CTRL(Imitation to Control Humanoid Robots Through Constrained Reinforcement Learning)是一个旨在解决现有人类运动到人型机器人的转换方法在物理可行性上的不足的框架。该框架通过在非物理基础的转换后的运动上施加受限的强化学习算法,提高了运动相似度,并确保了跟随参考人类轨迹的能力。研究团队对四种不同的人型机器人(Bruce、Atlas、H1 和 JVRC-1)进行了测试,证明了 I-CTRL 在不同机器人和大规模动作数据集上的泛化能力。通过使用简单且独特的奖励函数,I-CTRL 能够使用单一的强化学习代理来跟踪大约 10,000 种不同的动态运动。该研究的贡献包括:1) 实现了多种人型机器人的物理相容的人类 ähnliche 运动学习;2) 设计了一种新的样本高效的受限强化学习算法,该算法能够更好地保留目标运动的风格,并且能够泛化到大约 10,000 种运动,使用单一的策略和共享的奖励;3) 对四种不同的人型机器人进行了定量和定性的评估,展示了模型在不调整奖励的情况下的灵活性。

论文初读:

相关推荐
孤独且没人爱的纸鹤几秒前
【深度学习】:从人工神经网络的基础原理到循环神经网络的先进技术,跨越智能算法的关键发展阶段及其未来趋势,探索技术进步与应用挑战
人工智能·python·深度学习·机器学习·ai
阿_旭3 分钟前
TensorFlow构建CNN卷积神经网络模型的基本步骤:数据处理、模型构建、模型训练
人工智能·深度学习·cnn·tensorflow
羊小猪~~4 分钟前
tensorflow案例7--数据增强与测试集, 训练集, 验证集的构建
人工智能·python·深度学习·机器学习·cnn·tensorflow·neo4j
极客代码10 分钟前
【Python TensorFlow】进阶指南(续篇三)
开发语言·人工智能·python·深度学习·tensorflow
zhangfeng113310 分钟前
pytorch 的交叉熵函数,多分类,二分类
人工智能·pytorch·分类
Seeklike11 分钟前
11.22 深度学习-pytorch自动微分
人工智能·pytorch·深度学习
庞传奇12 分钟前
TensorFlow 的基本概念和使用场景
人工智能·python·tensorflow
华清远见IT开放实验室19 分钟前
【每天学点AI】实战图像增强技术在人工智能图像处理中的应用
图像处理·人工智能·python·opencv·计算机视觉
OpenVINO 中文社区28 分钟前
实战精选|如何使用 OpenVINO™ 在 ElectronJS 中创建桌面应用程序
人工智能·openvino
只怕自己不够好33 分钟前
《OpenCV 图像缩放、翻转与变换全攻略:从基础操作到高级应用实战》
人工智能·opencv·计算机视觉