GRASP 实验室研究论文解读 | 机器人交互：基于神经网络引导变分推理的快速失配估计

研究背景

在以人为中心的环境中，机器人与人类、周围环境或其他机器的物理交互需要兼顾柔顺性与安全性。尽管柔顺硬件能在一定程度上助力此类交互，但阻抗控制器作为扭矩控制机器人实现安全、被动响应接触并精准执行任务的关键，其有效性高度依赖机器人及所操作物体的精确动力学模型。

现实中，模型失配常导致任务失败和不安全行为，例如机器人末端执行器负载变化时，原有模型难以适应，可能引发轨迹偏移或不稳定。

宾夕法尼亚大学研究人员以Franka Research 3 机械臂为实验载体，提出了快速失配估计（RME）框架，这是一种自适应、与控制器无关的概率框架。

最新款Franka Research 3 具有7 自由度设计与可靠性能，让复杂的静态和动态交互实验得以顺利开展，充分验证了 RME 框架的有效性。

图 1：该框架无需外部力- 扭矩传感器，仅通过机器人的本体感受反馈，就能在线估计末端执行器的动力学失配，且能在约 400 毫秒内适应末端执行器质量和质心的突然变化，有效解决了模型失配带来的问题，保障了机器人在静态和动态场景下与环境交互的安全性和稳定性。

整体框架

RME 框架以贝叶斯推理为基础，结合神经网络和变分推理实现快速失配估计。首先通过失配检测算法监控外部扭矩的变化，判断是否出现动力学失配；当检测到失配后，收集相关数据并输入神经网络模型失配估计器得到先验分布；最后利用变分推理对先验分布进行优化，快速收敛到失配参数的估计值。

神经网络模型失配估计器

输入为末端执行器外部伪力序列，通过雅可比矩阵的阻尼伪逆从关节外部扭矩计算得到。

架构包含1D 卷积层（捕获局部模式，增强平移不变性）、位置嵌入和多头注意力机制（捕获全局依赖关系）、均值池化以及多层感知器（最终回归得到失配参数的先验均值）。

图3：RME 神经网络架构。在该网络中，我们输入维度为 RM×64 的伪力序列，依次应用卷积层、位置嵌入和多头注意力机制；随后对注意力分数进行均值池化，并应用一个序贯多层感知器，最终通过回归得到失配参数 θ。

在仿真中训练，使用350 次不同失配参数下的机械臂动力学模拟数据，采用均方误差损失和 dropout 防止过拟合。

变分推理

由于真实后验分布难以处理，构建平均场近似分布，通过最小化Kullback - Leibler 散度，等价于最大化证据下界（ELBO）来优化变分参数。

利用重参数化技巧和随机梯度下降（Adam 优化器）估计变分参数，确保快速收敛，加速估计过程。

**机械臂：**采用7 自由度 Franka Emika 扭矩控制机械臂，其配备嵌入式扭矩传感器，可提供关节扭矩等本体感受反馈。
**控制器：**使用约束被动交互控制器（CPIC），该控制器能在保证无源性的同时，通过二次规划（QP）优化处理运动学约束（如关节限制、自碰撞等），QP 优化通过 CVXGEN 实现。
**硬件环境：**实验在配备11 代 Intel Core i7 - 11700K @ 3.60 GHz CPU 的工作站上进行，无需 GPU 加速。
参数设。