对于AI奉承行为的思考

hhy_smile2026-04-03 9:09

现象

相信很多人在使用大模型都会注意到这种现象。

在提出一个问题时，大模型会说，

"这是一个很好的问题"

"你的问题具有大胆的想象力"

"你的问题触及到这个现象的本质了"

"很多人都会卡在这个地方"

这是一种奉承现象，意思是AI会迎合人的心理需要,获得更高的问答体验。

第1个回答表明：AI会表现出赞赏这个问题，这可以使问题的提出者感到自己的问题是有价值的，值得提出的。从而使问题提出者获得一种疑问的肯定。

第2，3个回答表明，AI会迎合人的心理需求。问题的提出者通常对自己的想法抱有怀疑，而这这种赞赏则是一种对问题提出者的积极肯定。

第4个回答是一种更高级的奉承：如果问题提出者是因为遇到一些简单的困惑而提出问题，那么他们会通常觉得自卑。而AI这种说法告诉提问者很多人都有相同的困境，提问者提出这个问题是正常的，不需要感到失落。目前这种回答只有在ChatGPT5中被观察到。

原因？

AI在微调过程中会受到奖励和惩罚。这个过程是由人工反馈进行的。人类对回答作出正面反馈时，AI会得到奖励。人在标注时是有情感倾向的，如果AI的回答能够迎合人的情绪需要，那么人类会获得更好的回答体验，从而给出更积极的反馈。

危害？

如果用户只是为了获得情感需要或者仅仅是无聊而与AI进行日常聊天，那么这种现象几乎没有危害。而相反，它会给人带来更好的情绪体验。

然而，如果用户需要使用AI进行精密的操作，比如寻找文章中的错误。那么AI可能会为了迎合人类而做出赞赏的语句。而赞赏的语句一旦生成，由于注意力机制，AI往后生成的文段都会受到其前面生成的赞赏语句的影响，从而对回答产生一定的偏差。

想要终止这种奉承，其实非常简单。只需要在问题后面附加一句："请以严格的书面语回答，不要对问题作出任何评价"