技术栈
skill discovery
MoonOut
18 天前
skill discovery
Skill Discovery | METRA:让策略探索 state 的紧凑 embedding space
主要内容:(deepseek 总结的,感觉比我写得好)这篇论文讲的是如何在没有奖励信号的情况下,让 agent 自己摸索出各种有用的动作技能。这很重要,因为如果机器人能自己学会很多基础技能(比如走路、转身、拿东西),以后学具体任务(比如送快递)就会快得多。下面,分析它的动机和方法:
MoonOut
21 天前
skill discovery
Skill Discovery | LGSD:用描述 state 的语言 embedding 的距离,作为 metra 的 d(x,y) 距离约束
(无论如何,感觉故事真好)
MoonOut
23 天前
skill discovery
Skill Discovery | DoDont:使用 do + don't 示例视频,引导 agent 学习人类期望的 skill
主要内容:这篇论文讲了一个关于让 AI 智能体 更安全、更高效地自学技能 的故事。核心是解决无监督技能发现(unsupervised skill discovery)中的两个大问题:学不会复杂技能、学会危险 / 无用技能。