谷歌推出基于Gemini 2.0的机器人AI模型

Gemini Robotics将AI带入物理世界

谷歌DeepMind正式推出基于Gemini 2.0的两款机器人AI模型:

  1. Gemini Robotics:先进的视觉-语言-动作(VLA)模型,新增物理动作输出模态,可直接控制机器人
  2. Gemini Robotics-ER:具备空间理解能力的增强模型,支持开发者调用其具身推理(ER)能力

核心技术突破

通用性

  • 利用Gemini的世界理解能力处理未见过的任务/物体/环境
  • 在泛化基准测试中性能达到其他SOTA模型的两倍以上

交互性

  • 基于Gemini 2.0的自然语言理解
  • 支持多语言即时指令响应
  • 实时环境监测与动态调整能力

灵巧性

  • 完成折纸、食品包装等精细操作
  • 支持多步骤复杂任务执行

多形态适配

  • 兼容ALOHA 2双臂平台
  • 适配Franka机械臂
  • 正在开发人形机器人Apollo的专用版本

安全架构

  • 底层运动控制安全机制(防碰撞/接触力限制)
  • 高层语义安全理解
  • 发布ASIMOV数据集推进安全研究
  • 采用数据驱动的"机器人宪法"框架

合作伙伴

  • Apptronik(人形机器人开发)
  • 波士顿动力等机构参与测试

查看技术报告

更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

公众号二维码

相关推荐
冬奇Lab30 分钟前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab30 分钟前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
AngelPP4 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年4 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼5 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS5 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区6 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤
知识浅谈6 小时前
教你如何用 Gemini 将课本图片一键转为精美 PPT
人工智能
Ray Liang6 小时前
被低估的量化版模型,小身材也能干大事
人工智能·ai·ai助手·mindx
shengjk18 小时前
NanoClaw 深度剖析:一个"AI 原生"架构的个人助手是如何运转的?
人工智能