对于AI奉承行为的思考

现象

相信很多人在使用大模型都会注意到这种现象。

在提出一个问题时,大模型会说,

  • "这是一个很好的问题"
  • "你的问题具有大胆的想象力"
  • "你的问题触及到这个现象的本质了"
  • "很多人都会卡在这个地方"

这是一种奉承现象,意思是AI会迎合人的心理需要,获得更高的问答体验。

  1. 第1个回答表明:AI会表现出赞赏这个问题,这可以使问题的提出者感到自己的问题是有价值的,值得提出的。从而使问题提出者获得一种疑问的肯定。
  2. 第2,3个回答表明,AI会迎合人的心理需求。问题的提出者通常对自己的想法抱有怀疑,而这这种赞赏则是一种对问题提出者的积极肯定。
  3. 第4个回答是一种更高级的奉承:如果问题提出者是因为遇到一些简单的困惑而提出问题,那么他们会通常觉得自卑。而AI这种说法告诉提问者很多人都有相同的困境,提问者提出这个问题是正常的,不需要感到失落。目前这种回答只有在ChatGPT5中被观察到。

原因?

AI在微调过程中会受到奖励和惩罚。这个过程是由人工反馈进行的。人类对回答作出正面反馈时,AI会得到奖励。人在标注时是有情感倾向的,如果AI的回答能够迎合人的情绪需要,那么人类会获得更好的回答体验,从而给出更积极的反馈。

危害?

如果用户只是为了获得情感需要或者仅仅是无聊而与AI进行日常聊天,那么这种现象几乎没有危害。而相反,它会给人带来更好的情绪体验。

然而,如果用户需要使用AI进行精密的操作,比如寻找文章中的错误。那么AI可能会为了迎合人类而做出赞赏的语句。而赞赏的语句一旦生成,由于注意力机制,AI往后生成的文段都会受到其前面生成的赞赏语句的影响,从而对回答产生一定的偏差。

想要终止这种奉承,其实非常简单。只需要在问题后面附加一句:"请以严格的书面语回答,不要对问题作出任何评价"

相关推荐
程序员cxuan14 分钟前
为每个任务配一套 harness:Claude Code 里的动态工作流
人工智能
程序员cxuan19 分钟前
Claude Fable 5 来了
人工智能·后端·程序员
云边云科技_云网融合23 分钟前
云边云科技亮相 2026 WOD 制造业数智化博览会 云网融合赋能制造焕新
人工智能·科技·安全·制造
Σίσυφος190030 分钟前
激光三角 光平面标定-多高度误差分析
人工智能·计算机视觉·平面
JS菌32 分钟前
手写一个 AI Agent 全栈项目:从沙箱执行到子智能体的完整实现
前端·人工智能·后端
lqqjuly38 分钟前
前沿算法深度解析(二)
人工智能·算法·机器学习
Bode_200240 分钟前
基于大数据分析的全生命周期质量追溯质量评估体系落地方案
大数据·人工智能
分布式存储与RustFS1 小时前
RustFS S3 Table 开源后,我重新梳理了一下 Iceberg 数据湖的选型思路
人工智能·开源·minio·dpu·rustfs·ai存储·s3 table
DevOpenClub2 小时前
用 Agent 搭建网页内容采集与结构化处理流水线
人工智能
56AI2 小时前
2026 企业级AI智能体开发平台推荐:聚焦底层安全与准确率的智能体平台
人工智能·安全·智能体