论文随笔 回到过去,关于具身智能与人机交互的思考

Hi,三碗饭最近在探索Robotics方向,在这里分享最近在看的一篇论文,随手写的随笔,希望对你们有启发。在传统认知科学中,人类常被视为处理抽象信息的"处理器"。然而,具身化(Embodiment)理论对此提出了挑战,认为我们的感知、体验和认知是由身体结构 以及实践参与共同塑造的,因此具身交互已成为人机交互(HCI)设计与评估的核心概念。


2001年,Paul Dourish 出版了《Where the Action Is》,正式将具身化 引入 HCI 的基础概念。

他汲取了温诺格拉德(Winograd)、弗洛雷斯(Flores)和苏克曼(Suchman)的现象学思想。

对比传统的"认知主义"(强调内部表征),具身交互更关注**"日常、平凡的经验"**,即行动者如何通过完成具体实践活动来理解世界。近年来的认知科学也演化出了更具身体性的"4E认知"(具身、嵌入、延伸、生成)。


论文中提到不同学者,从不同维度对具身交互进行了批判性探索:

  1. Paul Dourish:思考了具身化如何连接媒体艺术,并反思了"有形计算"与"普适计算"的术语选择。他认为书中关于"设计"的章节虽非教条,但却像美酒一样历久弥新。

批注:他质疑自己在书中将重点放在"有形计算"(Tangible Computing)而非更宽泛的"普适计算"(Ubiquitous Computing)是否合适。有形计算是指摸得着的实体交互,比如我们触摸台灯开关,灯就亮了,普适计算是无处不在的计算环境,比如智能家居的自动化。

  1. Kirsh:认为身体作为思考的建模工具,工具改变了我们感知环境和行动机会的方式。其通过分析舞者和编舞者如何利用身体作为**"辅助思考的模型"**,揭示了身体在支持认知中的核心作用,为 HCI 提出了新的研究议程。

批注:从舞蹈从业者的角度思考身体的作用似乎是很好的切入点,因为舞蹈,包括武术等需要的是全身的协调,身体作为一个模型,去感知世界,其是如何联系的?比如我们要做一个后空翻的动作,今年的CES展上有很多机器人已经可以完成这个动作了,这个动作需要手部,腰部,腿等身体部位的协调作用。

  1. Quek & Oliviera:开发了触觉手套界面。让视觉障碍学生能"感知"老师的指向性手势。该研究证明了具身交互在真实教学环境中的社会价值,帮助弱势学生与社会同步。

批注:这方面我有了解的是相关AR设备在HealthCare方面的应用,通过增强聋哑人(或者应该是听力障碍的人)通过扩大他们的听觉,使其可以和正常人一样通过声音获取信息。

  1. O'Hara 批判了"自然用户界面(NUI)"中固有的表征性自然感。引用梅洛-庞蒂的"客观身体"概念,强调必须关注"生活经验"。他们认为手势的意义产生于行动者、物质环境与社会互动的交织,而非简单的物理模拟。

批注:这里小编也不是很清楚这个 representational sense of naturalness, 应该是倾向HCI服务于生活,基于生活,现实的环境?

  1. Luff 等人:认为仅仅关注身体是不够的。通过"T-Room"(混合空间原型)的实验证明,身体嵌入的环境同样重要。只有保证环境的指称连贯性,远程协作中的谈话与视觉行为才能达成一致。

批注:把环境放入HCI,这里的理解是环境提供了光线(视觉),声音(听觉),味道(味觉)等等的信息,需用将这些信息对齐进行交互。

  1. Loke & Robertson:关注运动在感知和体验中的角色。提出**"移动与陌生化(Moving and Making Strange)"**方法论。该框架结合了"第一人称"体验视角以及人与机器作为"观察者"的视角,为运动交互的设计提供了系统评估方案。

批注:这个很有意思,简单来说就是改变传统观察方式,使人对同一件事物更有兴趣。 小编之前有一篇文章有讨论到其作者开发设备让用户增强某些感知, 举个例子,你在剥橘子,其会增强你剥橘子的产生的声音(因为很小,正常听不到),通过这样的方式,让用户将更多注意力放在手头上的事,而不是一边剥橘子一边看电视,一边和人说话, 这样可以让用户将重心回归手头的活,专注于当下的细节。

  1. Svanaes:强调身体具有通过技术进行自我重构的能力。 动觉创造力:强调设计师在设计过程中,身体直接参与和感受产品"触感维度"的能力。

批注:强调身体感知的延伸。


参考资料

CHI 2011 研讨会专刊导读

论文: Introduction to the Special Issue on the Theory and Practice of Embodied Interaction in HCI and Interaction Design

相关推荐
某林2122 天前
ROS 2 与大模型融合实战:从进程连环崩溃到类型安全防御的深度排障复盘
c++·python·安全·机器人·人机交互·ros2
byte轻骑兵2 天前
【AVRCP】规范精讲[26]: 旧遥控器如何控制新设备?播放命令跨版本兼容全流程解析
人机交互·avrcp·蓝牙耳机·车机蓝牙·音频控制
zlinear数据采集卡3 天前
状态指示灯电路深度解析:从板卡的“眼睛”到ZLinear采集卡的硬核人机交互实战
人机交互
声光界4 天前
《声音与音乐中的情感理解及人机交互设计》
人工智能·人机交互·声学
BSD_HY5 天前
薄膜开关的材料选型与可靠性验证:从PET与PC的对比说起
人机交互·制造·薄膜开关·深圳工厂
BSD_HY6 天前
国产工业硬件的“突围”:从薄膜开关看国产化替代背后的“隐形挑战”
人机交互·制造·薄膜开关·深圳工厂
byte轻骑兵6 天前
【AVRCP】规范精讲[23]: 字符集切换全流程与两种典型场景解析
网络·人机交互·媒体·avrcp·媒体控制·车机蓝牙
搞科研的小刘选手7 天前
【重庆大学主办】第三届智能感知与模式识别国际学术会议(IPPR 2026)
物联网·机器学习·计算机视觉·机器人·人机交互·感知·传感
某林2128 天前
ROS2 机器人底盘调试避坑指南:从 `/odom` 丢失到彻底跑通的硬核排障实录
stm32·机器人·人机交互
搬砖的小码农_Sky8 天前
Excel批量复制全攻略:从单列单行到高级场景
excel·人机交互