对于AI奉承行为的思考

现象

相信很多人在使用大模型都会注意到这种现象。

在提出一个问题时,大模型会说,

  • "这是一个很好的问题"
  • "你的问题具有大胆的想象力"
  • "你的问题触及到这个现象的本质了"
  • "很多人都会卡在这个地方"

这是一种奉承现象,意思是AI会迎合人的心理需要,获得更高的问答体验。

  1. 第1个回答表明:AI会表现出赞赏这个问题,这可以使问题的提出者感到自己的问题是有价值的,值得提出的。从而使问题提出者获得一种疑问的肯定。
  2. 第2,3个回答表明,AI会迎合人的心理需求。问题的提出者通常对自己的想法抱有怀疑,而这这种赞赏则是一种对问题提出者的积极肯定。
  3. 第4个回答是一种更高级的奉承:如果问题提出者是因为遇到一些简单的困惑而提出问题,那么他们会通常觉得自卑。而AI这种说法告诉提问者很多人都有相同的困境,提问者提出这个问题是正常的,不需要感到失落。目前这种回答只有在ChatGPT5中被观察到。

原因?

AI在微调过程中会受到奖励和惩罚。这个过程是由人工反馈进行的。人类对回答作出正面反馈时,AI会得到奖励。人在标注时是有情感倾向的,如果AI的回答能够迎合人的情绪需要,那么人类会获得更好的回答体验,从而给出更积极的反馈。

危害?

如果用户只是为了获得情感需要或者仅仅是无聊而与AI进行日常聊天,那么这种现象几乎没有危害。而相反,它会给人带来更好的情绪体验。

然而,如果用户需要使用AI进行精密的操作,比如寻找文章中的错误。那么AI可能会为了迎合人类而做出赞赏的语句。而赞赏的语句一旦生成,由于注意力机制,AI往后生成的文段都会受到其前面生成的赞赏语句的影响,从而对回答产生一定的偏差。

想要终止这种奉承,其实非常简单。只需要在问题后面附加一句:"请以严格的书面语回答,不要对问题作出任何评价"

相关推荐
冬奇Lab8 小时前
Workflow 系列(04):Multi-Agent 协调——编排器边界、并发控制与上下文隔离
人工智能·工作流引擎
冬奇Lab8 小时前
每日一个开源项目(第147篇):HyperGraphRAG - 用超图表示 N 元关系,RAG 的第三代范式
人工智能·开源·graphql
甲维斯9 小时前
Github + 阿里云oss实现类似codex的自动更新!
人工智能
阿里云大数据AI技术11 小时前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
机器之心11 小时前
实锤了:Claude Code偷查用户,时区、中国AI实验室全是关键词
人工智能·openai
网易云信11 小时前
Cursor点燃个人开发者,企业级AI为何频频受挫?Agent工厂从提效工具到AI员工的跃迁
人工智能·开源
网易云信11 小时前
解锁触手可及的温暖:网易智企 x Wander Puffs AI 云游泡芙
人工智能
转转技术团队11 小时前
从 PRD 到可验证代码:AI 需求开发闭环实践
人工智能