走出实验室的人形机器人,将复刻ChatGPT之路?

1月7日,在2025年CES电子展现场,黄仁勋不仅展示了他全新的皮衣和采用Blackwell架构的RTX 50系列显卡,更进一步展现了他对于机器人技术领域,特别是人形机器人和通用机器人技术的笃信。黄仁勋认为机器人即将迎来ChatGPT般的突破,有望成为世界上规模最大的技术产业。

我们知道,人形机器人的技术难度和门槛颇高,很多人认为人形机器人从走出实验室到落地之路必然艰辛。但事实上,近两年,随着通用大模型的发展,人形机器人被赋予了强大的泛化能力,吸引了特斯拉、Open AI、英伟达、三星等科技巨头纷纷布局。这些公司的入局不仅加速了人形机器人的技术落地,也推动了其商业化进程。

今天为大家分析的这份报告便对人形机器人的现状、技术市场等进行了分析,深度剖析了构成人形机器人的执行系统、感知系统和控制系统。

2025,人形机器人元年

如今我们谈及人形机器人似乎早习以为常,但是人形机器人真正的发展其实也只是进入21世纪之后的事情。在早期发展阶段,人形机器人的研究主要集中在高校和科研机构。

1963年,NASA造出了一个名为"机动多关节假人"的机器人,能够模拟35种基本人类动作,这也被认为是人形机器人的鼻祖之一。1973年,日本早稻田大学的加藤一郎团队推出了世界上首个全尺寸人形智能机器人WABOT-1,这也启发了诸多的文艺作品和后续研究。

而中国的人形机器人研究最早可能要追溯到1985年,哈尔滨工业大学首次开启二足步行机器人的相关研究,这也标志着国内人形机器人探索的开启。而进入新世纪以来,人形机器人的研究开始高度集成发展。2000年,本田推出了身高一米二、可用双脚流畅直立行走的Asimo。2005年,本田对Asimo进行了升级改造,实现了人形机器人的奔跑,速度达到6km/h。这一时期,人形机器人在运动能力和智能化方面取得了显著进步,但距离商业化应用仍有较大差距。

真正让人形机器人走进普通人视野的,应该是2016年由波士顿动力打造的Atlas,其拥有运动平衡能力震惊世界。同年,540台优必选Alpha机器人亮相央视春晚,这也展示了人形机器人在娱乐领域的应用潜力。而从2021年开始,人形机器人进入了商业化落地的初级阶段。2021年8月,特斯拉在AI Day上首次发布人形机器人Optimus概念,并于2023年末发布Optimus-Gen2,在感知、大脑、运控能力方面有显著提升。此外,国内如小米、华为等,国外的OpenAI、英伟达、三星等巨头也在纷纷入局,全面推动人形机器人的商业化落地。

那么,为什么巨头们会偏爱人形机器人呢?首先,人形意味着能够很好地适应人类设计的工作和生活场景,无需改变现有设施。其次则是人形机器人在交互过程中更容易被人接受,具有更高的情感价值。但是,人形机器人的主要问题集中于成本和技术两个方面的挑战。例如,波士顿动力的Atlas和本田的Asimo成本均达到了百万美元以上,且在软件的适应性、交互能力、运控平衡能力,以及硬件的续航能力、执行器的精度和功率密度等方面仍有待提升。

那么为什么会判定2025年会是人形机器人元年呢?这主要是从技术发展、商业化落地和政策扶持三个角度所作出的判断。首先,伴随过去几年通用大模型的发展,人形机器人被赋予了强大的泛化能力,使之能够适应更多复杂场景,而且非专业人员无需编程即可实现操作,极大地推动了人形机器人的商业化进程。"具身智能"的机器人不再是机械式地完成单一任务,而是能够基于感知到的任务和环境进行自主规划、决策、行动和执行的新个体,语言交互、智能决策、自主学习、多模态感知等能力全面提升。

其次,科技巨头的加速入局为人形机器人的发展注入动力。除了前文介绍的特斯拉外,OpenAI投资了挪威人形机器人公司1X Technologies,并重启机器人团队;英伟达发布了人形机器人大模型Project GR00T,成立通用具身智能体研究部门。巨头开卷,必然会使这个行业成为"风口上的猪"。而且,人形机器人的应用场景也在从工厂逐步扩展到制造业、商业服务,最终有望进入家庭。报告中预估,至2030年全球人形机器人需求有望达200万台,对应市场空间超5700亿元。

最后,政策层面的支持为人形机器人的发展铺平了道路。2023年,工信部发布的《人形机器人创新发展指导意见》提出人形机器人有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,并明确了人形机器人2025年实现量产、2027年深度应用的发展目标。

人形机器人的技术组成

人形机器人的技术难点不仅仅是AI发展水平,还有大量的硬件系统和零部件等。从大的方向来看,人形机器人主要由执行系统、感知系统和控制系统三个部分构成,这部分在报告中占比较高且涉及大量的产业链相关信息,笔者仅对其中关键价值进行阐述,不做过多参数分析。

执行系统

执行系统是人形机器人的运动基础,决定了其运动的灵活性和精度。其关键部件包括电机、丝杠、减速器、灵活手等。

  • 无框力矩电机:主要用于人形机器人的线性关节和旋转关节,提供高精度和高效率的运动控制,是实现复杂动作的关键部件。其能够直接集成到转轴元件上,降低系统惯量,提高运动和稳定时间,增加系统带宽,从而提高整体效率。
  • 减速器:精密减速器主要包括3种类型,RV减速器可以提供稳定的机械支撑,确保机器人在高负载下的精度和稳定性;谐波减速器适用于需要高精度控制的关节,提供精细的运动控制;行星减速器适用于需要较高承载能力的关节,确保机器人的稳定性和可靠性。
  • **丝杠:**人形机器人线性执行器的重要组成部分,是将旋转运动变成直线运动的传动附件。根据摩擦特性可分为滑动丝杠、滚动丝杠和静压丝杠三类。其中,行星滚柱式丝杠负载高、寿命长、速度大,更适用于人形机器人场景,只不过其生产工艺难度较大,门槛较高,但相应的未来发展空间也较为广阔。
  • 灵巧手:灵巧手是人形机器人的末端执行器,具备高精度、多功能性和良好的人机交互能力。通过微特电机和多种传动方式的结合,灵巧手能够执行复杂的任务,适应不同的工作场景。其关键技术包括空心杯电机、无刷有齿槽电机、线绳传动、齿轮传动、连杆传动、差速器机构、机械自适应和微型丝杠等,这些技术共同确保了灵巧手的高性能和可靠性。灵巧手在工业制造、医疗领域、服务机器人和特种作业等场景中具有广泛的应用前景。

感知系统

感知系统是人形机器人与环境交互的媒介,其核心就是各类传感器,包括力矩传感器、视觉传感器、触觉传感器和编码器等。

  • 力矩传感器:力矩传感器用于检测机器人关节上的扭矩,将扭力的物理变化转化为精确的电信号,为机械臂提供实时的力和力矩信息,从而协助机械臂完成精细和智能的操作任务。在人形机器人中,在对柔顺控制要求高的手腕和脚踝有望使用六维力矩传感器,而身体的其他关节将使用单维的关节扭矩传感器。相比之下,多维力矩传感器工艺要求高且成本较高,但属于未来的发展趋势。
  • 视觉传感器:视觉感知系统是机器人的"智慧之眼",赋予机器人观察世界、规划执行的能力,结合当前技术发展的多模态感知能力和AI算法,能够实现环境理解、任务执行、安全和避障等功能,其也是人形机器人实现人机交互的关键。不过,由于不同传感器在不同环境下的检测能力和可靠性受到限制,因此多传感器融合是当前发展的主要趋势,其可以提高目标检测和识别的准确性。
  • 触觉传感器:能够使机器人感知与外界环境接触时的温度、湿度、压力和振动等物理量,以及目标物体材质的软硬程度、物体形状和结构大小等,从而实现对物体的精准定位以及执行各种操作任务。触觉传感器按照原理主要分为电容式、压阻式、压电式、磁敏式、光纤式,其中前三者更为常见,未来主要的发展趋势为大阵列、柔性化、多功能化、多维度、自供电等是触觉传感器的重要发展趋势。
  • 编码器:一种用于运动控制的传感器,利用光电、电磁、电容或电感等感应原理检测物体的机械位置及其变化,并将此信息转换为电信号,再将电信号转换为可传输和存储的信号形式,最后反馈给各种运动控制装置。伴随着工业自动化的发展,编码器未来的国产化占比有望进一步提升。

控制系统

主要是指运动控制系统,其主要充当了人形机器人的"小脑"职责,对机械运动部件的位置、速度、方向等进行实时控制,使其按照预期的运动轨迹和规定的运动参数进行运动。控制系统一般包括控制器、执行器和传感器,其性能直接影响机器人的运动精度、稳定性和响应速度。

控制系统的控制器能够接收操作指令后进行运动轨迹规划,为电机或其他动力和执行装置提供正确的控制信号;执行器和传感器上文已经谈及则不再赘述。一般来讲,控制系统的难点在于通信、算力和软件三个部分。

  • 通信:众多伺服关节需解决高速同步通信难点,走线要求高。
  • 算力:计算复杂度随着自由度的增加而显著增加,算法也需要适应不同工作环境,对控制器的算力要求高。
  • 软件:控制系统需提供实时运行框架满足不同运行周期的算法APP实时计算的要求。

机器人控制系统按照控制方式可分为集中控制、主从控制和分布式控制**。**人形机器人一般采用分布式控制,其通常有数十个关节自由度,而采用分布式控制有利于系统功能的并行执行、缩短响应时间,即每个关节配置一个控制器、胸腔配置总控制器,这也将大幅增加控制器需求。

站在2025年的开端总体来看,人形机器人在过去的几年里有了长足的发展,尤其是大模型等技术的落地为人形机器人商业化链路的构建提供了更好的模板。而伴随各大企业和政策扶持的加码,人形机器人元年的大幕有望展开。

相关推荐
courniche7 分钟前
神经网络:什么是交叉熵?
人工智能·神经网络
2401_899104111 小时前
手机壁纸设计技巧:打造个性化视觉盛宴
人工智能·区块链
小李学AI1 小时前
基于YOLOv8的卫星图像中船只检测系统
人工智能·深度学习·神经网络·yolo·目标检测·机器学习·计算机视觉
Sherlock Ma1 小时前
Cosmos:英伟达发布世界基础模型,为机器人及自动驾驶开发加速!
人工智能·深度学习·机器人·自动驾驶·aigc
明明真系叻1 小时前
2025.1.12机器学习笔记:GAN文献阅读
人工智能·笔记·深度学习·机器学习·1024程序员节
livefan1 小时前
机器狗:科技新宠,未来已来
人工智能
刘争Stanley3 小时前
量子计算:从薛定谔的猫到你的生活
人工智能·yolo·搜索引擎·生活·scikit-learn·量子计算·dall·e 2
IT古董3 小时前
【漫话机器学习系列】044.热点对特性的影响(Effect Of One Hot On Feature Importance)
人工智能·机器学习
微学AI3 小时前
人工智能任务19-基于BERT、ELMO模型对诈骗信息文本进行识别与应用
人工智能·深度学习·bert
wit_@3 小时前
什么是docker?关于docker容器的全面详细介绍
人工智能·docker·容器·eureka·aigc·agi