具身沟通——机器人和人类如何通过物理交互进行沟通

早期研究主要集中在设备设计,即开发能够安全接触和感知的硬件,例如外骨骼、假肢和机器人手臂。随着硬件能力的提升和计算能力的增强,算法设计逐渐成为决定 pHRI 系统实用性的关键因素。从基于物理模拟的 admittance control 等方法,到利用多模态通信渠道进行高级推理的计算方法。现有的算法方法主要支持特定任务的 pHRI,但难以推广到通用的人机协作。因此,本文主张涌现的具身对话是 pHRI 的下一个前沿方向。涌现的具身对话指的是通过持续的交互,双向、多模态的交流方式会自然形成。 人类和机器人可以共同塑造交流协议,并随着时间的推移不断改进他们的交流能力。这种交流方式能够促进更灵活、更有效的人机协作,并拓展 pHRI 的应用范围。随着机器人能力的提升,pHRI 不再是问题,而是改善人机沟通和协作的机会。硬件方面取得了显著进展,包括系列弹性执行器、协作机器人、分布式感知等。感知和界面技术的进步使得 pHRI 更实用,尤其是安全性方面。计算能力的提升使得复杂算法的实时执行成为可能。然而,pHRI 的算法设计仍然是重要的下一步。新的算法方法可以赋予现有信息渠道新的功能,使其成为具身沟通的途径,即通过动作、显式界面和物理接触进行多模态交流。这些进步使得我们能够设计之前无法实现的 pHRI 方面,例如机器人和人类在使用过程中进行对话的机会。传统 pHRI 方法 主要基于单向沟通,通常是机器人通过观察来推断人类意图并提供相应的帮助。这种沟通方式虽然有效,但无法充分利用人机协同的潜力,例如协商方法、相互适应环境和协调对新颖事物的反应。因此,它不太适用于新的、非结构化的交互,更适合特定的应用场景。为了使机器人成为通用的协作伙伴,我们需要更好的沟通能力。有效的人机沟通 依赖于双向、多模态的对话。人类沟通有两种方式:代码模型和指示-推理模型。代码模型通信通过关联来实现,而指示-推理模型通信则依赖于表达和识别意图的能力。人类-机器人协作可以从指示-推理模型中获得启示,通过双向沟通来增强协作能力。代码模型: 通过明确的符号进行沟通,例如摩尔斯电码。这种沟通方式效率高,但缺乏灵活性,难以进行流畅的协作。指示-推理模型: 依赖于表达和识别意图的能力。任何行为都可以用于沟通,只要它能够影响另一个代理的心理状态。自然语言是使指示-推理沟通更精确和更表达的工具之一。人机协作可以从指示-推理模型中受益,因为它更符合人类的沟通方式。目前的人机沟通往往过于依赖代码模型,例如手势和自然语言,或者通过生物信号(如 EMG 和 EEG)来传递意图。这些方式可能不足以实现流畅的设备使用,并且可能不是最佳的人机沟通方式。人们擅长适应和开发新的沟通协议,因此,我们应该更多地关注 pHRI 中具身沟通的涌现,而不是复制熟悉的 pHRI 沟通规范。目前的人机协作应用中,pHRI 主要被避免或完全规定。机器人通常被视为人类意图的被动观察者;在某些场景中,它可以提供反馈。尽管这种具身沟通方式能够在特定任务的限制内实现成功的协作,但在无法预测的场景中进行有效的协作将需要人机对话------即基于协作伙伴的心理模型和交互历史进行的多模态信息交换------并且安全地融入间歇性物理接触。因此,开发新的算法工具来促进多模态对话并使沟通规范得以涌现是 pHRI 的下一个前沿方向。如果我们能够实现人机对之间的灵活对话,那么人机协作将能够在目前不切实际的应用中成为可能,例如在家中共同存在或在机器人辅助执行日常活动期间进行持续康复。1. 持续适应和安全保证: 随着数据驱动方法的学习能力的不断提高,我们需要更多的可证明的安全界限,这些安全界限不会不必要地约束人机交互或限制整体性能。2. 多模态对话: 尽管许多现有的解决方案依赖于机器人从其人类伙伴产生的沟通信号中推断意图,但一些方案也允许双向沟通,即机器人向人类伙伴提供反馈。机器人不仅接收信号,还能发出反馈,这种持续的双向沟通能促进更灵活的协作。3. 涌现式界面:人机交互中,不必预先设定全面的多模态符号库,通过互动逐渐建立相关规范,扩展沟通能力。4. 数据集和基准测试:随着算法增多和比较评估的成本增加,建立强大的基准测试和可靠的数据共享机制可以加速创新,降低实验成本和入门障碍。

相关推荐
狼头长啸李树身4 小时前
机器人交社保属于“无稽之谈”?
网络·机器人·媒体
半只小闲鱼6 小时前
如何让ai问答机器人通人性?
人工智能·机器学习·机器人
一颗小树x6 小时前
【机器人】复现 ASGrasp 通用透明物体重建、6-DoF抓取预测
机器人·红外·asgrasp·通用透明物体抓取·6-dof抓取
蜂耘6 小时前
OpenAI与谷歌DeepMind新品同日竞技,谁能引领机器人现实任务新潮流?
机器人
杰克逊的日记12 小时前
机器人的硬件设备的寄存器或其他控制接口能识别的程序
机器人·机器人大脑
新加坡内哥谈技术13 小时前
Gemini Robotics:Google DeepMind 让 AI 机器人真正“动”起来!
人工智能·深度学习·语言模型·自然语言处理·机器人·copilot
Mountain and sea1 天前
焊接机器人与线激光视觉系统搭配的详细教程
人工智能·opencv·机器人
max5006001 天前
作物移栽机器人的结构设计的介绍
开发语言·python·机器人
越来越胖的GuanRunwei1 天前
机器人触觉的意义
人工智能·机器人·触觉传感