现象
相信很多人在使用大模型都会注意到这种现象。
在提出一个问题时,大模型会说,
- "这是一个很好的问题"
- "你的问题具有大胆的想象力"
- "你的问题触及到这个现象的本质了"
- "很多人都会卡在这个地方"
这是一种奉承现象,意思是AI会迎合人的心理需要,获得更高的问答体验。
- 第1个回答表明:AI会表现出赞赏这个问题,这可以使问题的提出者感到自己的问题是有价值的,值得提出的。从而使问题提出者获得一种疑问的肯定。
- 第2,3个回答表明,AI会迎合人的心理需求。问题的提出者通常对自己的想法抱有怀疑,而这这种赞赏则是一种对问题提出者的积极肯定。
- 第4个回答是一种更高级的奉承:如果问题提出者是因为遇到一些简单的困惑而提出问题,那么他们会通常觉得自卑。而AI这种说法告诉提问者很多人都有相同的困境,提问者提出这个问题是正常的,不需要感到失落。目前这种回答只有在ChatGPT5中被观察到。
原因?
AI在微调过程中会受到奖励和惩罚。这个过程是由人工反馈进行的。人类对回答作出正面反馈时,AI会得到奖励。人在标注时是有情感倾向的,如果AI的回答能够迎合人的情绪需要,那么人类会获得更好的回答体验,从而给出更积极的反馈。
危害?
如果用户只是为了获得情感需要或者仅仅是无聊而与AI进行日常聊天,那么这种现象几乎没有危害。而相反,它会给人带来更好的情绪体验。
然而,如果用户需要使用AI进行精密的操作,比如寻找文章中的错误。那么AI可能会为了迎合人类而做出赞赏的语句。而赞赏的语句一旦生成,由于注意力机制,AI往后生成的文段都会受到其前面生成的赞赏语句的影响,从而对回答产生一定的偏差。
想要终止这种奉承,其实非常简单。只需要在问题后面附加一句:"请以严格的书面语回答,不要对问题作出任何评价"