GRASP 实验室研究 论文解读 | 机器人交互:基于神经网络引导变分推理的快速失配估计

研究背景

在以人为中心的环境中,机器人与人类、周围环境或其他机器的物理交互需要兼顾柔顺性与安全性。尽管柔顺硬件能在一定程度上助力此类交互,但阻抗控制器作为扭矩控制机器人实现安全、被动响应接触并精准执行任务的关键,其有效性高度依赖机器人及所操作物体的精确动力学模型。

现实中,模型失配常导致任务失败和不安全行为,例如机器人末端执行器负载变化时,原有模型难以适应,可能引发轨迹偏移或不稳定。

宾夕法尼亚大学研究人员以Franka Research 3 机械臂为实验载体,提出了快速失配估计(RME)框架,这是一种自适应、与控制器无关的概率框架。

最新款Franka Research 3 具有7 自由度设计与可靠性能,让复杂的静态和动态交互实验得以顺利开展,充分验证了 RME 框架的有效性。

图 1:该框架无需外部力- 扭矩传感器,仅通过机器人的本体感受反馈,就能在线估计末端执行器的动力学失配,且能在约 400 毫秒内适应末端执行器质量和质心的突然变化,有效解决了模型失配带来的问题,保障了机器人在静态和动态场景下与环境交互的安全性和稳定性。

研究核心方法

整体框架

RME 框架以贝叶斯推理为基础,结合神经网络和变分推理实现快速失配估计。首先通过失配检测算法监控外部扭矩的变化,判断是否出现动力学失配;当检测到失配后,收集相关数据并输入神经网络模型失配估计器得到先验分布;最后利用变分推理对先验分布进行优化,快速收敛到失配参数的估计值。

神经网络模型失配估计器

输入为末端执行器外部伪力序列,通过雅可比矩阵的阻尼伪逆从关节外部扭矩计算得到。

架构包含1D 卷积层(捕获局部模式,增强平移不变性)、位置嵌入和多头注意力机制(捕获全局依赖关系)、均值池化以及多层感知器(最终回归得到失配参数的先验均值)。

图3:RME 神经网络架构。在该网络中,我们输入维度为 RM×64 的伪力序列,依次应用卷积层、位置嵌入和多头注意力机制;随后对注意力分数进行均值池化,并应用一个序贯多层感知器,最终通过回归得到失配参数 θ。

在仿真中训练,使用350 次不同失配参数下的机械臂动力学模拟数据,采用均方误差损失和 dropout 防止过拟合。

变分推理

由于真实后验分布难以处理,构建平均场近似分布,通过最小化Kullback - Leibler 散度,等价于最大化证据下界(ELBO)来优化变分参数。

利用重参数化技巧和随机梯度下降(Adam 优化器)估计变分参数,确保快速收敛,加速估计过程。

实验配置

  • **机械臂:**采用7 自由度 Franka Emika 扭矩控制机械臂,其配备嵌入式扭矩传感器,可提供关节扭矩等本体感受反馈。

  • **控制器:**使用约束被动交互控制器(CPIC),该控制器能在保证无源性的同时,通过二次规划(QP)优化处理运动学约束(如关节限制、自碰撞等),QP 优化通过 CVXGEN 实现。

  • **硬件环境:**实验在配备11 代 Intel Core i7 - 11700K @ 3.60 GHz CPU 的工作站上进行,无需 GPU 加速。

  • 参数设

  • **置:**凭经验将变分推理先验的标准差调整为σₚᵣᵢₒᵣ = [0.5, 0.02, 0.02, 0.05]

实验设计与验证

消融实验

分析神经网络对变分推理预测精度的影响:对比使用神经网络预测先验均值和先验均值为0 时的估计结果,表明神经网络引导显著降低了质心估计的均方误差。

图4:不同先验构造下RME估计失配参数θ的平价图比较;如图所示,神经网络引导允许更稳健的质心估计。

研究数据收集间隔长度的影响:评估不同间隔(50ms、100ms、200ms、300ms)下的估计精度,确定 200ms 为兼顾精度和效率的最优间隔。

Franka人机交互实验

实验

**场景:**在末端执行器添加未知质量,使机械臂动力学模型突然变化,测试其保持目标平衡位置和方向的能力。

图5:机械臂动力学在末端执行器上附加未知质量时的计算机仿真。该图比较了机械臂在应用失配之前的平衡位置(红线)与其在应用 500 克和 1100 克未知质量后不久的位置(红色球体),分别如左图和右图所示。

**结果:**RME 能快速准确估计失配参数,平均估计时间 226ms,使机器人快速收敛到平衡位置。

真实****实验

跟踪稳定极限环:机械臂在y-z 平面跟踪具有稳定极限环的动态系统,RME 能快速估计失配参数,使机器人收敛到期望轨迹,而无自适应时会出现伪吸引子。

图6:机械臂在受到动力学模型失配的情况下,跟踪 y-z 平面上具有稳定极限环的动态系统。

图7:机械臂在受到人类产生的扰动时对动力学模型的顺序变化的自适应。每个步骤表示修改末端执行器的动力学模型;两个步骤之间的 RME 预测表示对先前 θ 估计的立即纠正。

人机交互顺序自适应:人类将未知篮子连接到末端执行器并动态添加/ 移除重物,RME能准确估计失配参数,使机器人保持目标位置和方向,且对人类扰动保持被动。

图8:用于 RME 评估的末端执行器和未知物体。左图显示用于静态实验和极限环跟踪的 3D 打印篮子。右图描绘了带有 3D 打印连接器的市售篮子,用于人机交互的顺序自适应实验。

关键成果与突破

  • 实时性与高效性:实现了约400毫秒内对末端执行器质量和质心突然变化的估计与适应,远快于现有需要10秒系统识别的方法,满足实时交互需求。

  • 无需外部传感器:仅依靠机器人本体感受反馈进行估计,避免了外部力- 扭矩传感器带来的灵活性降低、有效载荷减少和成本增加等问题。

  • 保持系统无源性:在估计存在误差时,仍能保证闭环系统的局部渐近稳定性和相对于特定输入- 输出端口的无源性,确保交互安全。

  • 通用性与鲁棒性:与控制器无关,可应用于多种被动阻抗控制器;通过仿真训练和数据增强,对噪声具有鲁棒性,能从仿真迁移到现实场景。

结语

GRASP实验室提出的基于神经网络引导变分推理的快速失配估计框架,为机器人在动态环境中实现安全、高效的物理交互提供了重要解决方案。其在实时性、无需外部传感器、保持系统无源性等方面的突破,推动了机器人自适应控制技术的发展。

而Franka Research 3机械臂凭借其出色的性能,成为此次科研实验的得力助手,助力研究人员顺利完成各项复杂实验,为技术突破提供了可靠的硬件支持。

**项目详情:**https://mateusz-jaszczuk.github.io/rme/

相关推荐
深蓝学院2 小时前
智源研究院新研究:突破物理世界智能边界的RoboBrain 2.0,将重构具身AI能力天花板
人工智能·重构
做萤石二次开发的哈哈2 小时前
萤石安全生产监管解决方案:构建企业安全智能化防护网
大数据·人工智能
万米商云2 小时前
碎片化采购是座金矿:数字化正重构电子元器件分销的价值链
大数据·人工智能·电子元器件·供应链采购
GoldenSpider.AI2 小时前
马斯克访谈深度解读:机器人、AI芯片与人类文明的未来
人工智能·机器人·starlink·spacex·tesla·elon musk·optimus
伊莲娜生活2 小时前
大健康时代下的平台电商:VTN平台以科研创新重构健康美丽消费生态
人工智能·物联网·重构
健康有益科技2 小时前
大模型食材识别技术革新:AI重构精准营养管理
大数据·人工智能·计算机视觉·重构
算家计算2 小时前
阿里重磅开源Qwen3-Next!破局AI算力瓶颈,训练成本暴降
人工智能
Billy_Zuo2 小时前
人工智能机器学习——模型评价及优化
android·人工智能·机器学习
Web3_Daisy3 小时前
克隆代币 + 捆绑开盘:多链环境下的低成本发币玩法
人工智能·web3·区块链·比特币