技术栈
skill discovery
MoonOut
12 小时前
skill discovery
Skill Discovery | DoDont:使用 do + don't 示例视频,引导 agent 学习人类期望的 skill
主要内容:这篇论文讲了一个关于让 AI 智能体 更安全、更高效地自学技能 的故事。核心是解决无监督技能发现(unsupervised skill discovery)中的两个大问题:学不会复杂技能、学会危险 / 无用技能。