中科院自动化所人形机器人研究进展：全面综述与展望

作者：Yuchuang Tong, Haotian Liu, and Zhengtao Zhang
单位：中国科学院自动化研究所，中国科学院大学人工智能学院
论文标题：Advancements in Humanoid Robots: A Comprehensive Review and Future Prospects
出版信息：IEEE/CAA JOURNAL OF AUTOMATICA SINICA, VOL. 11, NO. 2, FEBRUARY 2024
论文链接：https://ieeexplore.ieee.org/abstract/document/10415857

主要贡献

论文提供了一个全面的概述，介绍了人形机器人领域的当前状态、技术进步和未来前景。通过对关键技术和研究工作的深入分析，论文为研究人员提供了对这一领域的整体理解。
详细探讨了人形机器人技术的各个方面，包括本体结构、控制、学习和感知，旨在推动该领域更广泛的研究进展。
强调了人形机器人在人类生活中的潜在应用，特别是在提高生活质量、辅助护理和教育等方面的作用。
描述了人形机器人研究的未来趋势和挑战，为研究人员提供了指导。

介绍

背景与定义：
- 人形机器人是设计得非常接近人类外观和行为的精密机器，能够模仿人类的感知、决策和交互功能。
- 这些机器人受到人类智能和适应性的启发，取得了显著的进步，超越了以往的限制。
优势：
- 人形机器人具有模仿人类行为的能力，能够在非结构化和动态环境中进行持续学习和适应。
- 人形设计使其在以人为中心的环境中更具适应性，促进了社会接受度和复杂的互动。
应用潜力：
- 人形机器人在医疗保健、教育和娱乐等领域具有广泛的应用潜力。
- 双足移动能力使它们能够在人类空间中高效导航，而先进的操作能力和灵巧性使它们能够执行复杂任务。
挑战：
- 尽管人形机器人具有诸多优势，但仍面临平衡和能效等挑战。
- 需要在硬件和软件领域取得进一步突破，以实现高度智能和多功能的人形机器人。
- 人形机器人是一个跨学科领域，涉及机械工程、电子学、计算机科学、人工智能、传感和驱动等多个领域。
论文组织结构：
- 论文讨论了人形机器人的不同方面，包括研究概述、结构与机制、控制与学习、感知与交互，以及潜在应用。
- 最后一部分探讨了未来的发展趋势和挑战。

人形机器人研究概述

A. 历史进展

人形机器人的探索始于20世纪70年代，并在21世纪初取得了显著进展。其发展可以分为三个阶段：

初始阶段（Late 1960s - Early 2000s）：
- 主要关注模仿人类外观和基本动作的双足步行机器人。
- 日本早稻田大学在这一领域处于领先地位，推出了WAP、WL、WABIAN和WABOT等一系列机器人，成功实现了基本的步行功能。
高度集成系统阶段（Early 21st Century）：
- 引入了传感和智能控制技术，具备初步的感知系统。
- 例如，本田公司的ASIMO 2000展示了潜在的应用能力，索尼的QRIO能够在2003年作为第一个能够跑步的人形机器人亮相。
- 法国BIP2000、索尼的SDR系列和韩国的HUBO也展示了令人印象深刻的能力。
突破性进展阶段（Recent Years）：
- 在动态运动方面取得了突破。波士顿动力公司和特斯拉在这一领域处于领先地位。
- 波士顿动力的ATLAS机器人展示了类似人类的感知、判断和决策技能，而"Petman"则通过调节体温和排汗来模拟人类生理学。
- 特斯拉的Optimus Prime预计将彻底改变人形机器人的大规模生产。

B. 研究思路

人形机器人目前有两个主要的研究方向：

追求人类外观：
- 侧重于复制人类外观和功能。通过借鉴人类行为，机器人能够以类似人类的方式执行任务。
- 代表机器人包括本田的ASIMO、北京理工大学的BHR和波士顿动力的Atlas。
强调功能性相似：
- 侧重于内部模仿核心机制，如骨骼肌肉系统，以实现与人类伙伴的深度合作。全球多个研究团队在这一领域取得了显著进展。

C. 文献分析

通过对Web of Science数据库中1900-2022年的文献进行搜索和分析，揭示了当前人形机器人研究的热点和趋势：

共引分析：早期研究主要由K. Hirai、S. Kajita和Q. Huang等人推动，近年来S. Kuindersma和K. Kaneko等学者也加入了这一领域。
国家和机构分析：主要研究国家包括日本、美国和中国，主要研究机构有日本的东京大学、早稻田大学和京都大学，中国的清华大学和北京大学，美国的麻省理工学院等。

关键词聚类分析：研究主要集中在人机交互、人体运动、路径规划、模仿学习、双足行走、虚拟现实和手势识别等领域。

D. 当前研究状态

中国

中国在人形机器人领域取得了显著进展，多家大学和研究机构在这一领域处于领先地位。

国防科技大学：开发了"Forerunner"机器人。
北京理工大学：开发了BHR系列机器人，展示了在不熟悉和复杂环境中的稳定行走能力。
哈尔滨工业大学 和清华大学：开发了成功的双足步行机器人和独特的传输结构。
中国公司：优必选开发了Alpha机器人，Walker服务机器人和小米的CyberOne机器人展示了中国在人形机器人领域的创新能力。

日本

日本在人形机器人研究方面一直处于领先地位，重点在于形态模拟，特别是开发复杂且逼真的仿生机器人，主要用于家庭和服务应用。
- Waseda University：自1976年推出WABOT系列以来，一直在推进双足步行技术的发展。WABIAN系列进一步丰富了双足步行、控制算法和人机交互领域。
- AIST（日本产业技术综合研究所）：通过HRP系列机器人，推动了双足步行、操作和人机交互的研究。HRP-4机器人能够模仿人类动作和操作，HRP-4C优化了运动技能和表情，HRP-5P增强了对外部力量的稳定性。
- 其他机构：东京大学开发的Kenshiro机器人展示了增强的灵活性，本田的ASIMO展示了在不平坦表面上行走、语音识别和避开障碍物的能力。

美国

美国的研究主要集中在理解人类大脑的机制和功能模拟，以在复杂环境中操作机器人。

MIT LegLab：采用气动伸缩腿机制，开发了平面双足和三维双足机器人，展示了快速奔跑和翻滚的能力。
MIT人工智能实验室：Kogo机器人模仿人类学习过程以执行特定任务。
Willow Garage：PR2机器人展示了复杂的操作能力，如折叠衣物和开门。
NASA：Robonaut 2在国际空间站上替代宇航员执行重复任务。
Agility Robotics：Cassie和Digit机器人展示了多功能的机器人移动能力。
Tesla：Optimus Prime展示了类似人类的灵巧性和稳定性，预计将在千家万户中部署。

其他国家

其他国家的研究受到中国、美国和日本的影响，推动了创新研究和发展。

法国：Aldebaran Robotics开发了ROMEO、Pepper和NAO等机器人，NAO广泛应用于学术领域。
德国：DLR开发了TORO机器人，强调手臂和步态的协调控制。
意大利：IIT开发了iCub和WALK-MAN机器人，COMAN机器人用于研究自然行走和跳跃动作。
比利时：布鲁塞尔大学开发了Lucy机器人，配备了气动人工肌肉。
英国：Engineered Arts开发了具有逼真表达和高级交互能力的机器人。
韩国：KAIST开发了KHR系列机器人，HUBO KHR-3机器人展示了高速行走和奔跑能力。

本体结构和模块

A. 机械设计

机械设计对于人形机器人至关重要，它不仅需要实现实用的人机交互，还需要为研究双足步行和相关技术提供平台。
机械设计通常从人类身体的复杂结构和细微运动中获得灵感。
机械设计的挑战在于如何在保持轻量化和经济性的同时，实现高精度和高性能的运动。

B. 分类

人形机器人可以根据尺寸分为成人尺寸和儿童尺寸两类：

成人尺寸：通常超过一米高，具备双足行走能力，拥有先进的控制系统、复杂的规划能力和丰富的AI感知技术。这类机器人适用于广泛的交互和应用场景。
儿童尺寸：通常较小，适用于桌面交互，具有简单的结构设计和低能耗。这类机器人适用于低负载、小尺寸和低功耗的应用场景。

C. 运动学、动力学和生物力学

人形机器人由于其高阶、复杂的相互作用和非线性特性，在运动学和动力学方面面临挑战。
传统的拉格朗日和牛顿-欧拉方程在处理这些问题时存在局限性。
研究人员正在探索神经网络、遗传算法和模糊逻辑等新方法，以提高鲁棒性和计算效率。

D. 处理单元

人形机器人通常包含一个或多个处理单元，选择合适的电子组件取决于具体的应用需求，如自主性、远程操作和任务类型。
常见的处理单元包括微型PC、Raspberry Pi板、ARM板、Arduino板和离板计算控制等。
随着机器人自由度的增加，所需的处理单元也变得更强大，导致系统成本上升。

控制、驱动和决策方法

A. 机器人控制方法分类

传统控制方法

零力矩点（ZMP）方法：基于ZMP的方法生成稳定的步态模式，但在速度和鲁棒性方面存在局限。
动态模型方法：基于动态模型的方法提供出色的稳定性和较低的计算复杂性，但通常局限于理想化的平坦地形。

优化控制方法

粒子群优化（PSO）、中央力优化（CFO）、模型预测控制（MPC）、轨迹优化（TO）：这些方法通过实时优化实现对广泛运动的精确控制，提升了机器人的平衡、适应性和多功能性。

模型控制方法

平衡策略、实时反馈、虚拟重力补偿（VGC）：这些方法利用机器人及其环境的动态模型来计算最优控制命令，确保精确和稳定的运动。

生物控制方法

CMAC（小脑模型关节控制器）、CPG（中枢模式发生器）：这些方法利用生物学原理，适用于特定环境，但对环境变化敏感。

学习控制方法

强化学习（RL）、示范学习：这些方法通过数据驱动的学习提升机器人的复杂运动技能和适应性。

B. 机器人控制领域的进展

行走控制

双足行走是人形机器人控制的基本挑战，研究集中在实现全方位行走、适应不同速度和地形的目标上。

平衡与稳定性控制

研究重点在于通过先进的算法增强平衡控制，确保在复杂环境中的稳定性。

行为控制

行为控制涉及自主、半自主和远程控制方法，研究方向包括路径规划、足迹规划和导航。

C. 驱动器

驱动器的选择对机器人的性能和效率有重要影响。常见的驱动器类型包括电动、气动、液压、形状记忆合金（SMAs）、电缆驱动和柔性驱动器。
每种驱动器都有其独特的优势和局限性，选择时需考虑应用需求、复杂性、力量和效率等因素。

D. 机器人的学习方法

强化学习

RL通过试错法或模拟环境学习，适用于复杂的任务和环境。

示范学习

示范学习通过模仿专家行为快速获取技能，适用于确定性任务。行为克隆（BC）和逆向强化学习（IRL）是两种主要的示范学习方法。

感知与交互

A. 传感器

传感器在机器人感知外部世界和与环境互动中起着至关重要的作用。有效融合和利用传感器信息是实现机器人基于传感器控制的基础。

视觉感知：
- 视觉系统是机器人感知外部世界的主要手段。单目和立体视觉系统被广泛应用于人形机器人中。
- 单目视觉系统无法提供精确的环境信息，而立体视觉系统可以测量目标距离，实现检测和避障等功能。
惯性测量单元：
- IMU结合加速度计、陀螺仪和磁力计，用于测量角度和角速度。
- IMU通常安装在机器人的上半身，用于测量相对于地面的角度和角速度。
多传感器融合感知：
- 在复杂和不确定的环境中，单一传感器往往不足以完成任务。
- 人形机器人通常配备多种传感器，如超声波、红外、激光扫描仪、相机、触觉传感器、压力传感器和IMU等。
- 通过融合这些传感器的数据，机器人可以在复杂环境中实现精确控制和任务执行。

B. 人机环境交互

人形机器人与人类和环境互动的能力是其重要特征之一。为了实现自然的互动，机器人需要具备物理、认知和感知能力。

物理交互：
- 机器人通过其机械结构和执行器与环境和人类进行物理互动。这种互动可以是直接的身体接触，也可以是工具的使用。
认知和感知交互：
- 机器人通过传感器系统收集和处理环境信息，实现对环境的理解和响应。高级的感知技术如视觉系统和IMU提供了必要的信息支持。
多模态智能交互：
- 机器人通过手势、语音和移动控制等方式与人类进行沟通。这些技术使得机器人能够在不同的应用场景中实现自然和有效的交互。

典型应用

A. 竞赛

竞赛是评估人形机器人能力的重要平台，通过特定的任务和标准来全面评估机器人的硬件和软件能力。一些著名的竞赛包括：

FIRA（国际机器人足球联盟）：专注于机器人的稳定性、复杂的运动规划和人机交互。
HuroCup联赛：旨在打造能够在复杂环境中执行多种任务的人形机器人，类似于"机器人奥运会"。
RoboCup竞赛：按人形机器人身体分类的足球比赛，提出了独特的挑战。
DARPA机器人挑战赛：专注于机器人在灾难情况下执行任务的能力。

B. 日常生活

人形机器人在日常生活中的应用潜力巨大，特别是在服务、医疗保健和娱乐行业中：

家庭服务：人形机器人可以承担家务劳动，帮助老年人，提供护理服务。
娱乐和旅游业：人形机器人可以作为娱乐表演者或导游，提升游客体验。
教育：人形机器人可以作为互动教学助手，提供个性化的学习体验。

C. 搜索和救援

在灾难和紧急情况下，人形机器人因其适应性和感知能力而被广泛应用：

灾害响应：人形机器人可以在危险或难以到达的区域执行搜索和救援任务。
核能管理：在核事故现场，人形机器人可以代替人类执行危险任务。

D. 军事和探索任务

人形机器人在军事和太空探索中具有潜在应用：

军事应用：人形机器人可以在辐射、尘土和有毒环境中执行任务，提供搜索和援助。
太空探索：人形机器人可以在空间站或行星探索任务中协助宇航员，执行科学实验和维护任务。

E. 工业应用

人形机器人在工业领域的应用可以提高生产效率和安全性：

制造业：人形机器人可以与人协作，执行装配、包装和物料处理等任务。
复杂制造：人形机器人可以进行精密装配和质量控制。

F. 医疗保健和辅助

人形机器人在医疗保健领域的应用可以改善患者护理和提高工作效率：

康复治疗：人形机器人可以帮助患者进行物理康复。
日常护理：人形机器人可以协助老年人和残疾人进行日常生活活动。

未来发展趋势与挑战

A. 新挑战

生物机制：
- 对于人形机器人来说，深入理解生物机制仍然是一个挑战。现有的研究缺乏对生物机制的全面了解，限制了机器人在复杂任务中的表现。
生物结构：
- 人形机器人的机械结构设计需要更加合理和复杂，以更好地模仿人体的结构和功能。现有的结构设计缺乏人体结构的合理性和复杂性。
生物材料：
- 高性能生物材料的研发不足，现有材料尚未得到广泛应用。需要进一步探索和开发新的生物材料以提高机器人的性能。
生物控制：
- 目前的控制方法在利用生物控制方法（如神经控制和肌电控制）方面进展有限。需要更深入地理解大脑智能机制和生物神经科学。
生物能量：
- 人形机器人的能量转换效率低，能耗高。需要进一步研究高效的生物能量转换和利用机制。
技术复杂性：
- 实现自然运动需要先进的控制和传感技术。解决稳定双足运动和人机交互等挑战需要跨学科的合作。
能源效率：
- 高能耗是双足机器人的主要问题，需要更高效的电源系统和能源管理。
成本：
- 高开发和维护成本限制了商业应用的普及。未来的研究应优化制造、材料和生产工艺以降低成本。
应用领域：
- 尽管人形机器人在某些领域表现出色，但在紧急响应等领域的性能、安全性和成本仍需改进。
机器学习和AI：
- 提升机器人的自主性和适应性需要更先进的机器学习和AI技术。
法律和伦理问题：
- 随着机器人融入社会，伦理和法律问题变得日益重要。未来的研究应关注法规和伦理以确保机器人的合法和道德使用。
用户接受度：
- 提升机器人的外观、动作和沟通能力以提高用户接受度和互动效果。
故障容忍和安全：
- 确保机器人的稳定性和安全性是关键。需要技术和管理上的协同努力以实现可靠的安全部署。

B. 未来发展趋势

生物机制：
- 深入研究人体解剖学、生理学和协调机制，以开发具有更高功能和逼真特性的人形机器人。
生物感知和交互：
- 开发准确和成本效益高的传感器，以增强机器人的感知、交互和决策能力。
生物结构：
- 从刚性到柔性的集成设计，以实现更自然和灵活的运动。
生物材料：
- 利用生物材料提高机器人的设计性能和功能。
生物控制：
- 通过先进算法和AI技术实现更精细的控制和决策能力。
生物能量：
- 研究高效的生物能量转换和利用机制，以提高机器人的能量效率。
软件系统：
- 开发综合的软件开发系统和平台，以简化开发过程并促进资源共享。
多机器人系统：
- 探索多机器人系统的协作和协调机制，以实现更广泛的应用。
人机共存安全：
- 探讨了在人类与机器人共享空间时如何通过技术、法规和最佳实践来确保双方的安全。
人机交互系统：
- 通过多模态信息融合技术提升机器人的交互能力。
跨学科研究：
- 通过跨学科合作推动人形机器人技术的进步。
学术界的角色：
- 学术界在推动人形机器人技术发展中扮演着重要角色，通过基础研究和人才培养推动技术创新。

总结

论文全面综述了人形机器人的研究现状、进展和未来前景，强调了生物机制、结构设计、材料应用、驱动和控制方法以及能量利用等方面的挑战。
通过集成仿生学、脑启发智能、力学和控制技术，人形机器人的未来发展前景广阔。
论文为研究人员提供了宝贵的资源，推动了人形机器人在各个领域的持续发展和潜力挖掘。