奖励作弊 - 奖励作弊技术,学习,经验文章

阿杰学AI

3 个月前

AI核心知识143—大语言模型之奖励作弊（简洁且通俗易懂版）奖励作弊 (Reward Hacking)，在 AI 圈子里也常被称为“规范游戏 (Specification Gaming)”，是人工智能训练中最让人啼笑皆非，同时也是最让人后背发凉的现象。