论文随笔 回到过去,关于具身智能与人机交互的思考

Hi,三碗饭最近在探索Robotics方向,在这里分享最近在看的一篇论文,随手写的随笔,希望对你们有启发。在传统认知科学中,人类常被视为处理抽象信息的"处理器"。然而,具身化(Embodiment)理论对此提出了挑战,认为我们的感知、体验和认知是由身体结构 以及实践参与共同塑造的,因此具身交互已成为人机交互(HCI)设计与评估的核心概念。


2001年,Paul Dourish 出版了《Where the Action Is》,正式将具身化 引入 HCI 的基础概念。

他汲取了温诺格拉德(Winograd)、弗洛雷斯(Flores)和苏克曼(Suchman)的现象学思想。

对比传统的"认知主义"(强调内部表征),具身交互更关注**"日常、平凡的经验"**,即行动者如何通过完成具体实践活动来理解世界。近年来的认知科学也演化出了更具身体性的"4E认知"(具身、嵌入、延伸、生成)。


论文中提到不同学者,从不同维度对具身交互进行了批判性探索:

  1. Paul Dourish:思考了具身化如何连接媒体艺术,并反思了"有形计算"与"普适计算"的术语选择。他认为书中关于"设计"的章节虽非教条,但却像美酒一样历久弥新。

批注:他质疑自己在书中将重点放在"有形计算"(Tangible Computing)而非更宽泛的"普适计算"(Ubiquitous Computing)是否合适。有形计算是指摸得着的实体交互,比如我们触摸台灯开关,灯就亮了,普适计算是无处不在的计算环境,比如智能家居的自动化。

  1. Kirsh:认为身体作为思考的建模工具,工具改变了我们感知环境和行动机会的方式。其通过分析舞者和编舞者如何利用身体作为**"辅助思考的模型"**,揭示了身体在支持认知中的核心作用,为 HCI 提出了新的研究议程。

批注:从舞蹈从业者的角度思考身体的作用似乎是很好的切入点,因为舞蹈,包括武术等需要的是全身的协调,身体作为一个模型,去感知世界,其是如何联系的?比如我们要做一个后空翻的动作,今年的CES展上有很多机器人已经可以完成这个动作了,这个动作需要手部,腰部,腿等身体部位的协调作用。

  1. Quek & Oliviera:开发了触觉手套界面。让视觉障碍学生能"感知"老师的指向性手势。该研究证明了具身交互在真实教学环境中的社会价值,帮助弱势学生与社会同步。

批注:这方面我有了解的是相关AR设备在HealthCare方面的应用,通过增强聋哑人(或者应该是听力障碍的人)通过扩大他们的听觉,使其可以和正常人一样通过声音获取信息。

  1. O'Hara 批判了"自然用户界面(NUI)"中固有的表征性自然感。引用梅洛-庞蒂的"客观身体"概念,强调必须关注"生活经验"。他们认为手势的意义产生于行动者、物质环境与社会互动的交织,而非简单的物理模拟。

批注:这里小编也不是很清楚这个 representational sense of naturalness, 应该是倾向HCI服务于生活,基于生活,现实的环境?

  1. Luff 等人:认为仅仅关注身体是不够的。通过"T-Room"(混合空间原型)的实验证明,身体嵌入的环境同样重要。只有保证环境的指称连贯性,远程协作中的谈话与视觉行为才能达成一致。

批注:把环境放入HCI,这里的理解是环境提供了光线(视觉),声音(听觉),味道(味觉)等等的信息,需用将这些信息对齐进行交互。

  1. Loke & Robertson:关注运动在感知和体验中的角色。提出**"移动与陌生化(Moving and Making Strange)"**方法论。该框架结合了"第一人称"体验视角以及人与机器作为"观察者"的视角,为运动交互的设计提供了系统评估方案。

批注:这个很有意思,简单来说就是改变传统观察方式,使人对同一件事物更有兴趣。 小编之前有一篇文章有讨论到其作者开发设备让用户增强某些感知, 举个例子,你在剥橘子,其会增强你剥橘子的产生的声音(因为很小,正常听不到),通过这样的方式,让用户将更多注意力放在手头上的事,而不是一边剥橘子一边看电视,一边和人说话, 这样可以让用户将重心回归手头的活,专注于当下的细节。

  1. Svanaes:强调身体具有通过技术进行自我重构的能力。 动觉创造力:强调设计师在设计过程中,身体直接参与和感受产品"触感维度"的能力。

批注:强调身体感知的延伸。


参考资料

CHI 2011 研讨会专刊导读

论文: Introduction to the Special Issue on the Theory and Practice of Embodied Interaction in HCI and Interaction Design

相关推荐
兵慌码乱10 天前
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析
python·opencv·计算机视觉·人机交互·手势识别·mediapipe·pyside2
BSD_HY15 天前
2026年FSR传感器行业报告:市场规模、竞争格局与发展趋势
人机交互·制造·fsr·薄膜开关·深圳工厂
某林21215 天前
从 Isaac Lab API 踩坑到硬件 MVP 的全链路实战破局
python·机器人·人机交互·ros2
洛星核17 天前
CrewAI 安装、使用方法详细全解
人工智能·github·人机交互·ai编程·agi·智能体
洛星核17 天前
Aider 安装、使用方法详细全解
人工智能·github·人机交互·ai编程·agi
Mr..Jackey18 天前
瑞佑 RUI Builder 图形化 UI 设计工具
arm开发·人工智能·单片机·ui·人机交互·ra8889·lcd控制芯片
元岳数字人小元18 天前
AI 数字人开发公司浅谈 虚拟数字人打造景区新服务
人工智能·人机交互·交互
小玮看世界18 天前
【技术成长实录】北京地铁12号线数据分析系统:从一个观察到一个完整项目的演进之路
python·人机交互·学习方法·cicd·项目交付
byte轻骑兵18 天前
【AVRCP】规范精讲[28]:媒体源上电全流程,蓝牙音频控制启动就靠这一套
网络·音视频·人机交互·媒体·avrcp
kaixinshier19 天前
【无标题】
大模型·人机交互·语音识别·tts·s100p