其实这些数学编码的运动基元方法非但没过时,反而在不少场景里的方向可以参考。
虽说神经网络是厉害,但它像个黑箱子,出了问题不好查,而且需要大量数据,实时性也未必能保证。
反观 DMP、ProMP 这些,数学模型清清楚楚,算得快,小数据就能用,在机器人要和人近距离协作或者涉及安全的场景里,这优势就很明显。
至于创新点,其实能挖的地方不少,突破口大多在于交叉、融合与解决新问题。
把这些数学模型和神经网络结合起来,用数学模型给神经网络做先验,帮它少走弯路,尤其小数据的时候效果可能更好。
**方向参考:**用神经网络学习基元参数、注意力机制筛选基元、生成对抗模仿学习方面。
再就是,现在机器人常遇到动态环境:桌子上突然多了个东西,怎么让 DMP 这些方法实时调整轨迹,同时保证安全和流畅,这就是个可以琢磨的方向。
还有多任务泛化,让一个 ProMP 模型同时处理抓杯子以及抓瓶子这些任务,不用每次都重新学,这里面能做的优化就很多。
方向参考: 精细任务的接触与操作、让机器人跳一段华尔兹(拟人化动作)、黎曼流形上的技能(在非普通的欧几里得空间。如何将DMPs等框架拓展到流形上,以更好地学习和泛化姿态技能,这也是个思路)
另外,这些方法的鲁棒性也能再提升,像结合感知信息(类似视觉识别到的物体位置),让运动基元能自动适应物体位置变化,而不是只能重复固定轨迹。
**方向参考:**提升复杂任务的结构化表达能力,运动基元的分割与重组、构建分层框架。
以及面向真实世界的鲁棒性与自适应的方向参考:
- 在线自适应: 将运动基元与在线学习、模型预测控制 结合,让机器人在执行过程中就能微调策略。
- 多模态传感信息融合:如何将视觉、触觉、听觉等信息有效地作为运动基元的输入或约束条件?
还有些更细分的应用场景,像医疗机器人,动作必须精准且可解释,数学编码的方法在这里就比纯神经网络更让人放心,研究怎么让这些方法适应不同病人的身体特征,就是个很有价值的点。
下面这些近年的论文也能说明还有人在深耕这些方向,你可以看看:
Dynamic Movement Primitives in Robotics: A Tutorial Survey
对相关现有文献进行了系统且全面的综述,并对 DMP 领域的最新研究成果进行了分类整理,并讨论了 DMPs 的局限性,并概述了未来可能的研究方向。

Safe Robot Trajectory Control Using Probabilistic Movement Primitives and Control Barrier Functions
给概率运动基元(ProMP)做了新控制设计,用分布里的函数让机器人沿轨迹走、状态不偏,能实时运行。

frontiersin.org/journals/robotics-and-ai/articles/10.3389/frobt.2022.772228/full
Improved Gaussian mixture model and Gaussian mixture regression for learning from demonstration based on Gaussian noise scattering
改进了机器人的模仿学习算法。通过给示范动作添加合理的噪声并优化模型,让机器人学得更快、动作更顺滑,有效解决了原来学得不像或动作生硬的问题。
