谷歌推出 AutoRT 机器人代理大规模编排的具体基础模型,远程操作和收集 77,000 个机器人事件

演示 AutoRT 向多个建筑物中的20 多个机器人提出指令 ,并通过远程操作和自主机器人策略收集77,000个真实的机器人事件。实验表明,AutoRT 收集的此类"野外"数据明显更加多样化,并且 AutoRT 使用 LLMs 允许遵循能够符合人类偏好的数据收集机器人的指令。

论文网址: https://huggingface.co/papers/2401.12963

更多消息:AI人工智能行业动态,aigc应用领域资讯

结合了语言、视觉和最近的行动的基础模型彻底改变了利用互联网规模数据来推理有用任务的能力。然而,训练具体基础模型的关键挑战之一是缺乏基于物理世界的数据。在本文中,我们提出了 AutoRT,这是一个利用现有基础模型在完全看不见的场景中以最少的人工监督来扩大操作机器人部署的系统。

AutoRT 利用视觉语言模型 (VLM) 进行场景理解和基础,并进一步使用大型语言模型 (LLMs) 提出由一组机器人执行的多样化且新颖的指令。通过利用基础模型的知识来指导数据收集,使 AutoRT 能够有效地推理自主权衡和安全性,同时显着扩大机器人学习的数据收集范围。

视频演示了 AutoRT 向多个建筑物中的20多个机器人提出指令,并通过远程操作和自主机器人策略收集77,000个真实的机器人事件。通过实验表明,AutoRT 收集的此类"野外"数据明显更加多样化,并且 AutoRT 使用 LLMs 允许遵循能够符合人类偏好的数据收集机器人的指令。

AutoRT的功能主要是能够收集到大量真实的机器人事件,这些事件可以用于训练和改进机器人的自主权衡和安全性。

应用于各种需要自主操作机器人的场景,例如:

  1. **物流和运输:**机器人可以在仓库中自动搬运物品,或在运输途中自动规划最佳路线。
  2. **制造业:**在制造业中,机器人可以自动完成生产线上的任务,提高生产效率和产品质量。
  3. **医疗服务:**在医疗领域,机器人可以协助医生进行手术操作,或为病人提供日常护理服务。
  4. **灾害救援:**在灾难发生时,机器人可以进入危险区域进行搜索和救援任务,帮助救援人员减少风险。

总之,AutoRT模型的应用场景非常广泛,可以帮助机器人更好地适应各种环境和任务需求,提高机器人的自主性和智能性。

相关推荐
mit6.82410 分钟前
[Agent开发平台] 后端的后端 | MySQL | Redis | RQ | idgen | ObjectStorage
人工智能·python
唤醒手腕28 分钟前
唤醒手腕2025年最新钉钉开放平台钉钉机器人stream搭建部署详细教程(更新中)
机器人·钉钉
GIOTTO情1 小时前
媒介宣发的技术革命:Infoseek如何用AI重构企业传播全链路
大数据·人工智能·重构
阿里云大数据AI技术1 小时前
云栖实录 | 从多模态数据到 Physical AI,PAI 助力客户快速启动 Physical AI 实践
人工智能
小关会打代码1 小时前
计算机视觉进阶教学之颜色识别
人工智能·计算机视觉
IT小哥哥呀1 小时前
基于深度学习的数字图像分类实验与分析
人工智能·深度学习·分类
机器之心2 小时前
VAE时代终结?谢赛宁团队「RAE」登场,表征自编码器或成DiT训练新基石
人工智能·openai
机器之心2 小时前
Sutton判定「LLM是死胡同」后,新访谈揭示AI困境
人工智能·openai
大模型真好玩2 小时前
低代码Agent开发框架使用指南(四)—Coze大模型和插件参数配置最佳实践
人工智能·agent·coze
jerryinwuhan2 小时前
基于大语言模型(LLM)的城市时间、空间与情感交织分析:面向智能城市的情感动态预测与空间优化
人工智能·语言模型·自然语言处理