人机交互(Human-Computer Interaction,HCI),是指关于设计、评价和实现供人们使用的交互式计算机系统,并围绕相关的主要现象进行研究。
狭义的讲,人机交互技术主要是研究人与计算机之间的信息交换,它主要包括人到计算机和计算机到人的信息交换两部分。
人机交互可以归结为为以下三个词:
人:了解人
机器:了解机器
互动:使得它们有效地合作
人机交互产品涉及内容
人机交互的产品开发内容涵盖了建模、设计、评估等理论和方法,以及在Web、移动计算、虚拟现实等方面的应用研究,主要包括以下内容:
1、人机交互界面表示模型与设计方法
一个交互界面的优劣,直接影响到软件开发的成败。友好的人机交互界面的开发离不开好的交互模型与设计方法。因此,研究人机交互界面的表示模型与设计方法是人机交互的重要研究内容之一。
2、可用性分析与评估
可用性是人机交互系统的重要内容,它关系到人机交互能否达到用户期待的目标,以及实现这一目标的效率与便捷性。对人机交互系统的可用性分析与评估的研究主要涉及到支持可用性的设计原则和可用性的评估方法等。
3、多通道交互技术
研究视觉、听觉、触觉和力觉等多通道信息的融合理论和方法,使用户可以使用语音、手势、眼神、表情等自然的交互方式与计算机系统进行通信。多通道交互主要研究多通道交互界面的表示模型、多通道交互界面的评估方法以及多通道信息的融合等。其中,多通道融合是多通道用户界面研究的重点和难点。
4、认知与智能用户界面
智能用户界面(Intelligent User Interface,IUI)的最终目标是使人机交互和人-人交互一样自然、方便。上下文感知、三维输入、语音识别、手写识别、自然语言理解等都是认知与智能用户界面解决的重要问题。
5、群件
群件是指为群组协同工作提供计算机支持的协作环境,主要涉及个人或群组间的信息传递、群组内的信息共享、业务过程自动化与协调以及人和过程之间的交互活动等。目前,与人机交互技术相关的研究内容主要包括群件系统的体系结构、计算机支持的交流与共享信息的方式、交流中的决策支持工具、应用程序共享以及同步实现方法等内容。
6、Web设计
重点研究Web界面的信息交互模型和结构,Web界面设计的基本思想和原则,Web界面设计的工具和技术,以及Web界面设计的可用性分析与评估方法等内容。
7、移动界面设计
移动计算(Mobile Computing)、普适计算(Ubiquitous Computing)等技术对人机交互技术提出了更高的要求,面向移动应用的界面设计已成为人机交互技术研究的一个重要内容。由于移动设备的便携性、位置不固定性、计算能力有限性以及无线网络的低带宽高延迟等诸多的限制,移动界面的设计方法、移动界面可用性与评估原则、移动界面导航技术以及移动界面的实现技术和开发工具,都是当前人机交互技术研究的热点之一。
人机交互过程中用户感知方式
1.视觉
视觉是人与周围世界发生联系的最重要的感觉通道。视觉感知可以分为两个阶段:
-
受到外部刺激接收信息阶段
-
解释信息阶段
一方面,眼睛和视觉系统的物理特性决定了人类无法看到某些事物;另一方面,视觉系统进行解释处理信息时可对不完全信息发挥一定的想象力。进行人机交互设计需要清楚这两个阶段及其影响,了解人类真正能够看到的信息。
2.听觉
听觉感知传递的信息仅次于视觉,其感知过程亦为接受刺激,把它的特性转化为神经兴奋,并对信息进行加工,然后传递到大脑。
声音的解释是与语言的理解联系在一起的,它们都是在大脑的听觉皮层中完成的。听觉系统就像视觉系统一样,可以利用以前的经验来解释输入。另外,由于口语充满着发错音的单词、不完整的句子,而且一般说的很快,所以听觉系统的解释机制必须跟得上输入。
3.触觉
触觉的感知机理与视觉和听觉的最大不同在于它的非局部性,人们通过皮肤感知触觉的刺激,人的全身布满了各种触觉感受器,用来感受冷热,疼痛和压力。触觉感知的另一个方面是动觉(kinaesthesia),即对人的躯干和四肢的位置的感觉。
人机交互系统需求
人机交互设计的最重要的因素是它的配置。任何给定的接口通常是由它提供的输入和输出的数量和多样性定义的。人机交互系统的体系结构显示这些输入和输出是什么,以及他们如何一起工作。
基于不同配置和设计的接口包括:
1.单峰人机交互系统
正如前面提到的,一个接口主要依靠它输入和输出设备的数量和多样性,这种渠道让用户可以通过此接口与计算机进行交互。每一个不同的独立的单通道称为方式。一个系统,是基于只有一个形态叫做单峰。
基于不同形式的性质,可以分为三个类别:
-
基于视觉
-
基于音频
-
基于传感器
基于视觉的人机交互
基于视觉的人机交互研究可能是该领域中最普遍的。考虑应用程序的范围和各种开放问题和方法,研究人员试图解决可视为视觉信号的人的不同方面的反应。主要研究领域包括:
-
面部表情分析
-
身体运动跟踪(大型)
-
手势识别
-
凝视检测(眼动跟踪)
由于应用的不同每个地区目标也不同,但是每个区域的普遍观念是大体一致的。
面部表情分析一般是处理视觉情绪认知。这个领域的研究焦点是人体运动跟踪和手势识别,这个领域可以有不同的研究目的但他们大多是用于直接命令中人与计算机的互动。
目光检测则主要是以间接形式的使用户与机器间进行互动,更好地理解用户的注意力,意图或敏感的情况。一个例外是帮助残疾的眼跟踪系统,它主要作用在命令和动作场景,如指针运动,闪烁,点击。
值得注意的是,一些研究人员试图协助甚至取代其他类型的相互作用(音频,传感器为主)与视觉方法。例如,唇读或唇运动跟踪是已知的用于语音识别的纠错的一个有效的帮助。
基于音频的人机交互
基于音频的计算机和人之间的交互是人机交互系统的另一个重要领域。这个领域处理不同的音频信号获得的信息。
虽然音频信号的性质可能不可以作为视觉信号,但从音频信号收集到的信息可以更值得信赖,更有用,在某些情况下,成为独特的信息提供者。音频人机交互的组成部分包括:
-
语音识别
-
说话人识别
-
听觉情感分析
-
人为噪声/登录检测(喘气,感叹,笑,哭,等)
-
音乐互动
语音识别和说话人识别的研究一直是主要的焦点。最近的努力是在人机交互分析领域整合人类情感。
相比其他的音调和音高的语音数据,典型的人类听觉的迹象,如叹息,惊呼等帮助的情感分析,设计更智能化的人机交互系统。
音乐的生成和互动是一个人机互动艺术领域非常新的应用,它主要集中在音频和视觉研究中。
基于传感器的人机交互
基于传感器的人机交互在各个领域的广泛应用。这些不同领域的共性是在人机交互中至少有一个物理传感器。这些传感器可以非常原始或非常复杂。
-
笔式交互
-
鼠标和键盘
-
操纵杆
-
运动跟踪传感器和数字转换器
-
触觉传感器
-
压力传感器
-
味道/气味传感器。
这些传感器已经存在了一段时间,也有一些非常新的技术。
笔式传感器主要在移动设备领域,并且涉及到笔势和手写识别领域。键盘、鼠标和操纵杆应用更加广泛。运动跟踪传感器/数字转换器是的最先进的技术,它彻底改变了电影、动画、艺术和游戏产业。
触觉和压力传感器应用在机器人和虚拟现实领域。新的机器人包括数以百计的触觉传感器,使机器人敏感和有触摸能力,这些类型的传感器还用于医疗手术应用
2.多通道人机交互系统
多通道人机交互系统是指的多通道组合多个形式。在MMHCI系统,系统响应输入,即沟通渠道。这些渠道的定义是继承自人类类型的通信,基本上是他的感官:视觉、听觉、触觉、嗅觉和味觉。
用机器进行交互包括但不限于这些类型。因此,通过两个或者两个以上是输入模式而不是传统的键盘和鼠标设备,这些输入设备的类型和工作模式可能相差很大,多通道界面将整合不同组合的语音、手势、目光、面部表情和其他非传统模式的输入。
最普遍的一种支持的输入组合方法是手势和语音。现在的多通道人机交互统含单个交互的方式,相关性的组合,而且大多数现有的多通道系统区分对待,只在最后将不同的方式结合在一起。
例如,嘴唇运动跟踪(视觉基础)可以帮助语音识别方法(音频基础),语音识别方法(音频基础)可以帮助命令采集在手势识别(视觉的基础)。