斯坦福为懒人献上大礼!机器人洗衣做饭逗猫看呆网友,成本3万美元自己也能DIY

叠不叠被子的世界难题有解了

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

起床叠不叠被子的世纪之争,终于要有解了?

爆火的斯坦福全能家务机器人,那真是把网(lan)友(ren)们激动坏了。

不仅自己就能熟练做饭:

还会自己刷锅、收拾椅子:

在人类指导下,煮咖啡:

叠衣服:

连整理床铺、套枕套都能精准搞定:

浇花、拖地板、开瓶盖,甚至逗猫猫,只要人类能比出相应的动作,对Ta来说都不在话下......

在这么一只"田螺机械臂"的背后,是斯坦福团队升级版机器人控制方案Mobile ALOHA。

上一代的ALOHA控制的还只有一组机械臂,只能在固定的位置做一些相对简单的工作。

现在它的协调性强到令人发指,网友们不禁感叹,机器人进化的速度实在是太快了!

在上,也有专业人士说,去年他曾认为这样的机器人会在3-5年内出现,这次的成果实在是难以置信。

PyTorch之父Soumith Chintala也称赞,这是一项很酷的新成果。

有人迫不及待地表示,自己的厨房里急需一个这样的机器人,求助哪里能买到。

对此,传奇程序员卡马克认为,人们可能有些过度乐观了,广泛通用型的机器人可能不会在AGI出现之前落地,但同时也表示自己愿意"被打脸"。

虽然量产可能还要等待些时日,但是作者给出了DIY教程,总成本大概只有32000美元,控制程序只要一台3070Ti的笔记本就能运行。

作者提供的装配方案使用了机械臂、移动平台等成品模块,如果能对这些组件进一步DIY,成本还能再降低不少。

△关于组装成本,官方清单显示为32000美元

支持自主学习,还能DIY

ALOHA支持真人遥控操作和全自动两种工作模式。

只要我们不时对机器人进行训练,然后等Ta彻底学会,就可以连比划的过程都一起省了。

研究人员就发现,在堆满家具的复杂环境中,机器人系统仅通过少量的人类示教,就学会了各种复杂移动操纵任务,如叫电梯、开柜门、擦桌子等。

学习过程中,移动底座的速度与双手的14自由度等操纵信息,一同作为示范算法的输入,和ALOHA静态数据一起对系统进行联合训练。

而且该系统不仅兼容多种示教学习算法,而且对于用户而言,掌握教学的方法也十分容易。

而如果采用真人操作,Ta可以做出更为复杂的菜色。

只见Ta在操控之下,一气呵成地打鸡蛋、焯虾仁,翻炒,然后出锅装盘,熟练得和经验丰富的大厨毫无二致......

新一代ALOHA在原有的机械手臂基础上,增加了一个差分驱动的移动底座。

这款底座是专为物流环境所设计的,移动速度为1.6米每秒,和人类的步行速度接近,可以承载100公斤的重物。

操控者的腰部与底座连接,可以直接反馈驱动轮子,实现移动控制;同时两只手控制机械手臂,完成全身协调操作。

自动模式下,这些操作则是由计算机完成。

此外,研究团队开源了全部的软硬件设计,包括机械结构、电路,以及训练所用的代码和数据,还有详细的DIY教程。

按照作者的教程,搭建这样一个机器人平台大概需要32000美元,大约相对于23万人民币,其中成本最高的是移动平台和机械臂,还有用于自动控制的电脑。

不过这些组件的价格变化也比较快,比如作者花了9000美元的移动平台现价降低了1000美元,机械臂的价格则涨了500多。

至于其他部件,除了电池贵一些需要699美元外,其余组件的美元价格均不超过三位数。

未来,研究者计划缩小机器人的体积,并提高手臂的自由度,软件层面也将让机器人学会自主探索......

那么朋友,你心动了吗?(手动狗头)

官网地址(含论文、代码、教程):
mobile-aloha.github.io/

参考链接:
twitter.com/zipengfu/st...

相关推荐
冬奇Lab1 天前
一天一个开源项目(第39篇):PandaWiki - AI 驱动的开源知识库搭建系统
人工智能·开源·资讯
冬奇Lab2 天前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
冬奇Lab3 天前
一天一个开源项目(第37篇):awesome-selfhosted - 自托管软件资源集合
开源·自动化运维·资讯
冬奇Lab4 天前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab5 天前
一天一个开源项目(第35篇):GitHub Store - 跨平台的 GitHub Releases 应用商店
开源·github·资讯
冬奇Lab7 天前
一天一个开源项目(第33篇):MyCodeAgent - 面向学习的 Claude Code 风格代码代理框架
人工智能·开源·资讯
冬奇Lab8 天前
一天一个开源项目(第32篇):Edit-Banana - 让不可编辑的图表变成可编辑,SAM3+多模态大模型驱动
人工智能·开源·资讯
冬奇Lab11 天前
一天一个开源项目(第29篇):Open-AutoGLM - 用自然语言操控手机的 Phone Agent 框架
人工智能·开源·资讯
冬奇Lab13 天前
一天一个开源项目(第27篇):Awesome AI Coding - 一站式 AI 编程资源导航
人工智能·开源·资讯
冬奇Lab14 天前
一天一个开源项目(第26篇):ZeroClaw - 零开销、全 Rust 的自主 AI 助手基础设施,与 OpenClaw 的关系与对比
人工智能·开源·资讯