谷歌推出 AutoRT 机器人代理大规模编排的具体基础模型,远程操作和收集 77,000 个机器人事件

演示 AutoRT 向多个建筑物中的20 多个机器人提出指令 ,并通过远程操作和自主机器人策略收集77,000个真实的机器人事件。实验表明,AutoRT 收集的此类"野外"数据明显更加多样化,并且 AutoRT 使用 LLMs 允许遵循能够符合人类偏好的数据收集机器人的指令。

论文网址: https://huggingface.co/papers/2401.12963

更多消息:AI人工智能行业动态,aigc应用领域资讯

结合了语言、视觉和最近的行动的基础模型彻底改变了利用互联网规模数据来推理有用任务的能力。然而,训练具体基础模型的关键挑战之一是缺乏基于物理世界的数据。在本文中,我们提出了 AutoRT,这是一个利用现有基础模型在完全看不见的场景中以最少的人工监督来扩大操作机器人部署的系统。

AutoRT 利用视觉语言模型 (VLM) 进行场景理解和基础,并进一步使用大型语言模型 (LLMs) 提出由一组机器人执行的多样化且新颖的指令。通过利用基础模型的知识来指导数据收集,使 AutoRT 能够有效地推理自主权衡和安全性,同时显着扩大机器人学习的数据收集范围。

视频演示了 AutoRT 向多个建筑物中的20多个机器人提出指令,并通过远程操作和自主机器人策略收集77,000个真实的机器人事件。通过实验表明,AutoRT 收集的此类"野外"数据明显更加多样化,并且 AutoRT 使用 LLMs 允许遵循能够符合人类偏好的数据收集机器人的指令。

AutoRT的功能主要是能够收集到大量真实的机器人事件,这些事件可以用于训练和改进机器人的自主权衡和安全性。

应用于各种需要自主操作机器人的场景,例如:

  1. **物流和运输:**机器人可以在仓库中自动搬运物品,或在运输途中自动规划最佳路线。
  2. **制造业:**在制造业中,机器人可以自动完成生产线上的任务,提高生产效率和产品质量。
  3. **医疗服务:**在医疗领域,机器人可以协助医生进行手术操作,或为病人提供日常护理服务。
  4. **灾害救援:**在灾难发生时,机器人可以进入危险区域进行搜索和救援任务,帮助救援人员减少风险。

总之,AutoRT模型的应用场景非常广泛,可以帮助机器人更好地适应各种环境和任务需求,提高机器人的自主性和智能性。

相关推荐
光羽隹衡几秒前
《深度学习》CUDA安装配置、pytorch库、torchvision库、torchaudio库安装
人工智能·pytorch·深度学习
深圳市快瞳科技有限公司2 分钟前
基于计算机视觉的鸟类数量统计技术原理解析
人工智能·计算机视觉
SelectDB技术团队3 分钟前
慢 SQL 诊断准确率 99.99%,天翼云基于 Apache Doris MCP 的 AI 智能运维实践
大数据·数据库·人工智能·sql·apache
模型启动机4 分钟前
对话奥特曼:OpenAI的真实未来蓝图
人工智能·ai·chatgpt·大模型
lusasky5 分钟前
AI领域开发TOP开源产品-GitHub-2025
人工智能·开源·github
智驱力人工智能7 分钟前
超越识别 将光学字符识别(OCR)技术转化为可靠业务能力的交付思维 光学字符识别 金融票据OCR识别系统 物流单据自动识别技术
人工智能·opencv·算法·目标检测·ocr·边缘计算
jiayong2310 分钟前
AI应用领域编程语言选择指南:Java vs Python vs Go
java·人工智能·python
yi个名字14 分钟前
从 Vibe Coding 到 MCP 智能体:在 IDE 里搭建可部署的工作流与 API 应用
ide·人工智能
_illusion_15 分钟前
反向传播的人生哲学:深度复盘的力量
人工智能·python·机器学习
OpenCSG17 分钟前
GLM-4.7上线:国产开源编码大模型的新进展
人工智能·开源·opencsg·agentichub