好你个稚晖君,居然搞突袭,一脚踹飞了机器人二次开发的高门槛。
在智元机器人首届合作伙伴大会上,智元机器人联合创始人、CTO 稚晖君_(彭志辉)_,发布了机器人动作与表达创作平台灵创平台 (LinkCraft)。
他首先陈述了一个当下的现象:
大家能看到网上有很多展示机器人灵活、生动、自然表现的视频,但翻来覆去就那几段动作。
对此,他的解释是这样的------
这些机器人的开发门槛太高了,想要让机器人实现这种高动态的全身控制,需要有非常深厚的强化学习加模仿学习的训练技巧------这都是专业人士才能做的事情。
所以一般都是由厂商针对某些问题训得比较好之后,开放 OTA 升级,升级一个动作的 OTA,机器人才能多会一个动作。
因为希望有一个方便大家二次开发机器人的东西,所以智元推出了灵创平台。
它被稚晖君称为杀手级应用。
灵创平台是个啥?
灵创平台定位为一个 AI 加持、面向创作者和开发者的机器人动作与表达创作平台,未来愿景是 "让机器人像人一样表达,让创作者像导演一样自由编排"。
具体来说,你买回来一台人形机器人,想要它有 demo 视频中的良好表现,或者无痛学会新的动作技能,不需要再费劲训练它。
丢给灵创平台,像用剪映剪视频一样,在 3D 场景里 "剪辑" 你想让机器人完成的行为。
底层逻辑很清晰------
用 AI 把机器人二次开发复杂的过程抽象成一个个模块化工具,以此支持机器人动作的自由编排和表达定制。
稚晖君介绍时表示:"以往的机器人动作演示需要专业人员进行调试,操作难度较大,灵创平台可以提供各类标准动作模板,降低创作者编排调试机器人动作演示的难度。"
用户生成自创机器人动作后,就成了自己的资产,不仅能反复调用,还可以与他人共享、组合、混剪。
稚晖君介绍,这套玩法背后是智元一整套自研 AI 模型在底层托举。

据悉,灵创平台并不是为某一台机器人量身打造的。
当前灵创平台已经适配了智元旗下的人形机器人灵犀 X2,以后将扩展至更多形态的硬件设备。
今年 10 月,灵创平台将上线 beta 版本。
所谓 "0 门槛",怎么用?
稚晖君在大会现场展示了灵创平台的用法------
在电脑或手机上打开灵创平台官网,屏幕分左右两栏。
左边有包含动作库、prompt 输入区等在内的各种选项,右边窗口负责预览和更精细调整机器人动作。
最简单的用法,就是在左侧的既定动作库中,选择你想让机器人学会的新动作,比如打哈欠、挥手、鞠躬、鼓掌...... 随点随看,每一个动作都实时在右侧窗口预览。
如果你觉得它学得还 ok,就可以给现实世界里的机器人安排上了。
有没有感觉到,照这个办法,以前有 0 代码编程,现在有 0 代码二次开发机器人了~
官方介绍也表示,灵创平台 "可将机器人二次开发难度降低到 0 门槛"。

稚晖君介绍,灵创平台动作库中目前已有上百个标准化动作,智元官方还会继续填充动作库。
这里有个有点意思的玩法,用户有自己想 "教" 机器人的动作,可以录制一段真人演示视频_(不需要任何动捕设备)_,上传到灵创平台,AI 会识别原视频中人物肢体动作,再由 AI 作 retarget,变成右边窗口里能预览的机器人成品动作效果。
根据动作难度的不同,训练时间从几十秒到几十个小时不等。
右侧的窗口里,可以靠拖动来增减具体参数,进行更精细的动作编辑,对机器人动作 "逐帧雕刻"。

此外,灵创平台可以根据用户上传的音频,自动分析其中的语义和情绪,并生成与之匹配的自然动作。
比如给它一段悲伤语调的音频,灵创平台会生成机器人耷拉肩膀、低头的动作。
另一个功能很像 "演绎编排":
在灵创平台输入文本,AI 合成语音,然后选定想要的词语,规定说该词语时对应要做出的动作,机器人就能按部就班地乖乖听话开始它的 "表演"。
One More Thing
大会现场,智元秀出了新款机器人:
灵犀 X2-W。
这是一款收纳起来占地不到 0.5㎡的轮足式人形机器人,具备高自由度双臂及仿生手腕以及灵巧三指手,目前尚处原型阶段。

在现场播放的灵犀 X2-W 展示视频中,它弯曲 "膝盖",用手打开了扫地机器人的开关,扫地机器人麻溜工作去了。
能理解,这个行为可以展示它各个方面的能力嘛!
但一瞬间幻视迪士尼 IP 某经典画面:
大家都是狗,但高飞是 "人",得牵狗绳出门遛布鲁托_(顶锅盖跑开)_。
欢迎在评论区留下你的想法!
--- 完 ---