HCI多模态人机交互技术探索

基于计算机和数字化技术的发展,信息化智能化的人机交互系统已经被广泛应用于军事指挥、交通管理、航空航天、核电等各类安全要求严格的领域中,传统的人机交互方式能否与操作人员的认知能力相适应,将直接影响人机交互过程的高效性和可靠性。

以智能座舱为例,ErgoHCI探索了与HMI人机交互原型的新型交互手段,进一步实现与HMI系统的语音+手势+触控+生物识别+脑机等智能交互,同步控制仿真显示系统以及模拟器硬件系统,实现更自然化、高效化、智能化的交互形态。

该技术也可被应用于各类信息交互系统、智能用户界面、人机控制、人工智能、智能家居、医疗辅助系统、虚拟环境等。本文将带你了解技术前沿---新型人机交互技术!

什么是人机交互?

人机交互(Human--Computer Interaction,简称HCI),主要是研究人与机器或系统界面交互关系的问题,主要依赖于信息的输入、处理和输出三个主要流程。以当前指控系统的人机交互模式为例,主要以指点、按键这种串行、单通道、精确式的交互手段为主。

但是长期单一反复的操作模式易诱发操作人员的生理疲劳与精神压力,同时伴随智能化的发展,人机交互系统表现出信息源的显著增长以及环境的瞬息万变,从而导致对人员的反应时间急剧压缩,单位时间内的人机交互任务大幅度增加。因此,当前越来越多的领域专家以及研究者提出在精确交互方式基础上增加新型辅助交互方式,如眼控、手势、语音等,更好的降低操作负荷,提高操作效率与安全性。

ErgoHCI人机交互方式

传统的交互技术主要包括鼠标交互、键盘交互、触控交互、VR手柄交互以及按键交互等,ErgoHCI新型交互技术实现语音交互、手势交互、脑机交互、眼控交互、情感交互以及语音交互等。

// 触控交互 //

触控交互是人机交互领域最早出现的交互方式之一,也是主要的精确式交互手段,包括鼠标交互、键盘交互、手指交互等,依托于鼠标、手指点击位置以及键盘按键进行界面现实及结果的反馈,有效提高用户使用计算机的体验和效率。

// 眼控交互 //

随着眼动设备精确度的提高,目前眼控已经成为新型交互方式中最常见的一种方式。眼控技术是通过利用图像获取与处理技术,对人的视线进行精确跟踪并应用于人机交互的控制数据源,可以更好地理解用户的注意力,分析用户的意图,作为除鼠标和键盘之外的又一个输入通道。

如:在高过载环境下,飞行员肢体活动困难,追踪目标时眼球移动先于头部移动,利用眼睛注视方向瞄准比用头部位置瞄准能更快地锁定目标并发起攻击;还可以进行眼动控制,利用人眼注视位置进行定位、锁定等操作;通过采集、分析实战训练中飞行员的视线动作,评判其技能、心理、意图等,提升训练效果,辅助现场操作和决策等。

// 语音交互 //

语音交互是人类最自然的交互方式,信息量大,效率高,包括智能语音识别、听觉情感分析、人为噪声、主动声音技术等,也已成为系统中重要的人机交互方式之一。

如:结合作战使用过程中飞行员对飞机的操控方式,基于自然语言理解的语音交互方式,可在机载装备中进行语音控制(基于语音交互的穿透性,也可以提高飞行员对多层菜单选择或多画面调度等);语音识别(可以快速地实现各种文字和数字组合信息的输入功能);语音查询(避免飞行员频繁的视线切换,减少视觉疲劳)等,很大程度上提升工作效率。

// 情感交互 //

情感计算就是赋予计算机系统识别、理解和表达人的情感状态的能力,使系统更智能化和人性化。通过机器识别、理解、表达和适应人类情感的能力,从而进行情感信号的获取和量化、情感信号的分析、建模及识别、情感理解和反馈、情感合成与表达实现人机交互。

如:通过测量操作人员的生理数据来监测个体的情绪、负荷等状态,并触发软硬件进行系统的自适应。在自动驾驶中可以通过监测驾驶员的疲劳水平,触发车接管人操作模式。

// 手势交互 //

手势交互属于体感交互的一部分,也是目前人机交互方式的趋势之一,其特点在于用户在与系统进行人机交互时,可以直接使用手势作为"控制器",与虚拟场景中的物体进行互动或反应控制,而无需接触设备或穿戴任何其他的控制设备。

如:可以通过手势交互替代部分传统的飞行员辅助性的触控操作,例如翻页、显示画面布局调整、数值增减调节、菜单条目选择等操作;对于飞行员操纵飞机过程中,飞行员潜意识手势动作与控制意图含义一致的控制操作,可使用手势交互方式进行控制;或配合语音控制快速实现对无人机的指控等。

// 脑机交互 //

基于脑电信号实现人脑与计算机或其他电子设备的通讯和控制。对大脑皮层的脑电信号进行收集,然后对该信号进行处理和特征提取,通过信号控制及信息反馈机制来完成脑机信息交互。即将脑电信号由设备转换为控制信号从而实现相应功能,最后给予大脑反馈信息。可以用于军事训练、运动想象控制、以及人员的状态识别等。

// 肌电控制 //

肌电控制是基于表面肌电信号,通过电极记录下来的神经肌肉活动。通过表面肌电信号可以控制机械设备:如小汽车或机器人,利用不同范围或不同肌肉群的肌电信号控制车或机器人的前进、倒退、左右转弯等,使得人的意识与机械设备统一,实现人机一体化。

ErgoHCI基于多模态交互方式的模拟海上演练系统

基于ErgoHCI新型人机交互技术,同步采集操作人员的眼动数据、生理数据、脑电数据、手势交互、语音数据等多模态信号源,对其进行信号处理与特征值提取、AI建模整个流程,搭建在平面模式以及三维环境下的模拟海上演练系统。

整体介绍:创建二维与三维场景融合的模拟海上演练系统,同时结合新型隐式人机交互技术进行任务操作,进而提升作业效率,保证系统的人因安全性与可靠性。具体的交互方式包括:

语音交互:发现可疑目标,语音交互"发射"进行导弹发射。

手势交互:左手握拳和张开进行海域地图的缩小与放大,右手水平张开上升和下降动作进行海域地图的上移与下移,右手垂直张开左移和右移进行海域地图的左移和右移,右手握拳左移和右移进行炮台方向的左转与右转。

眼控交互:通过眼动状态及注视时长控制信息面板的展开与关闭、按钮的点击以及标签的激活。

触摸交互:通过触摸及键鼠控制按钮的点击、导弹的发射、标签的激活、面板的展开与关闭等。

ErgoHCI在新型智能化人机交互技术上不断探索,致力于打造集多模态交互方式于一体的智能化人机交互测评系统。

相关推荐
7***37453 小时前
前端体验的隐性力量:微交互、认知负担与情绪设计的技术实践思维
前端·交互
飛6795 小时前
解锁 Flutter 沉浸式交互:打造带物理动效的自定义底部弹窗
flutter·交互
刘 怼怼6 小时前
FreeXGIS + Cesium 实现三维场景多标记点与自定义交互标牌开发
microsoft·交互
漫长的~以后7 小时前
全模态交互革命:阿里Qwen3-Omni-Flash深度解析,拟人化AI的奇点已至
人工智能·交互
song5019 小时前
鸿蒙 Flutter 支付安全:TEE 可信环境下的支付校验实战
分布式·flutter·百度·重构·交互
灰灰勇闯IT1 天前
RN核心语法与组件体系:UI布局与基础交互
ui·交互·rn
song5011 天前
鸿蒙 Flutter 语音交互进阶:TTS/STT 全离线部署与多语言适配
分布式·flutter·百度·华为·重构·electron·交互
灰灰勇闯IT1 天前
RN原生模块交互:打通JS与原生的桥梁
开发语言·javascript·交互
Kingfar_11 天前
解密脑电设备:从电极到数据采集,脑电设备的工作原理
科技·人机交互·可用性测试·用户体验