skill discovery

Skill Discovery | 无监督技能发现的经典工作总结

Skill Discovery | RGSD：基于高质量参考轨迹，预训练 skill space首先，RGSD（reference guided skill discovery）这篇文章做的是技能发现（skill discovery），即，希望 agent 在没有人工设定奖励的情况下，自己学出一组多样且有意义的技能，以便后续用于各种任务（如走到某处、躲避障碍）。

Skill Discovery | METRA：让策略探索 state 的紧凑 embedding space主要内容：（deepseek 总结的，感觉比我写得好）这篇论文讲的是如何在没有奖励信号的情况下，让 agent 自己摸索出各种有用的动作技能。这很重要，因为如果机器人能自己学会很多基础技能（比如走路、转身、拿东西），以后学具体任务（比如送快递）就会快得多。下面，分析它的动机和方法：

Skill Discovery | LGSD：用描述 state 的语言 embedding 的距离，作为 metra 的 d(x,y) 距离约束（无论如何，感觉故事真好）

Skill Discovery | DoDont：使用 do + don't 示例视频，引导 agent 学习人类期望的 skill主要内容：这篇论文讲了一个关于让 AI 智能体更安全、更高效地自学技能的故事。核心是解决无监督技能发现（unsupervised skill discovery）中的两个大问题：学不会复杂技能、学会危险 / 无用技能。

我是有底线的