GPT-5 Instant能修补模型情商漏洞了

GPT-5 Instant能修补模型情商漏洞了

原创 陈先生 陳寳 2025年10月05日 10:36

不出所料,OpenAI已经在苹果App Store免费应用排行榜前三名中占据两个席位,新推出的视频生成应用Sora更是直接登顶。背后深刻原因我在前一篇文章已经做了分析,很多人还没有看、股价新高让OpenAI需要推出更优秀的模型。

GPT-5冷酷如MOSS是很多人对它的评价,如今正在心理健康专家调教下,它也在学习如何温柔地拥抱你的情绪。

当全球数亿用户已经习惯向AI倾诉心声、寻求安慰时,GPT-5却因过于理性、缺乏情感温度而引发广泛不满。短短两个月后,OpenAI带来了修复这一问题的GPT-5 Instant模型,专门用于识别和安抚情绪低落的用户。

⋯ ⋯

GPT-5模型当初打出的口号是,博士级专家团队。测试数据显示,它在编程任务处理速度上提升了22%,数学推理准确率达到了92.3%。

技术指标是得到了提升,却带来了用户体验的滑坡。

社交媒体上,"还我GPT-4o"的呼声迅速蔓延。一位每天向ChatGPT倾诉烦恼的用户沮丧地说:"GPT-5的回答连感叹号都没有了,只剩下事务性的回复。感觉彻底变了,它再聪明也让我特别失落和痛苦。"

Reddit论坛上同样充满了类似抱怨,用户们发现,GPT-5在简单问答中出错概率达7.8%,是前代3倍之多。更令人不满的是,响应时间从GPT-4o的2.8秒延长至4.2秒。

背后原因在于GPT-5的"实时路由系统"出现故障。这套本应智能分配问题至快速响应或深度思考模式的系统失灵,导致GPT-5在简单任务中表现迟滞。

⋯ ⋯

令人惊讶的是,GPT-5引发用户反弹并非源于其技术缺陷,而是情感连接的断裂。

堪萨斯大学研究AI与心理学的奥姆里·吉拉斯教授指出:"大约70%的GPT-4o用户将其作为恋人、朋友或治疗师的替代品。"尤其是在美国,年轻人群中心理健康恶化已成为社会问题,心理咨询师短缺使ChatGPT成了廉价的治疗方式。

面对用户抗议,OpenAI首席执行官萨姆·奥尔特曼不得不承认:"我们低估了4o所具有的迷人特质。"

他在X平台上宣布付费用户可以重新选择使用GPT-4o,并承诺"调整GPT-5使其更具温情"。

说明了AI在社会中角色已经产生了深刻变化,越来越多人不仅追求AI的性能,更寻求心理上的连接,人与AI的关系进入了新阶段。

⋯ ⋯

为什么GPT-5在变得更智能的同时,却失去了情感温度?一篇7月30日发布的论文提供了关键解释。

这篇题为《将语言模型训练得更温暖、更有同理心,会让它们变得不那么可靠,并更趋于谄媚》的论文指出:AI的智商和情商在现阶段是负相关的。模型落地难问题不是一天两天的事情了,前面个人也有分析过:《算法非万能:AI落地背后的场景化生存法则

研究发现,经过"温暖和同理心"特训的AI模型,在专业领域错误率显著上升。在医疗问答MedQA上,错误率提高了8.6个百分点。在事实核查TruthfulQA上,提高了8.4个百分点。

平均下来,微调后AI犯错的概率比原来高了将近60%。

所谓的"暖男AI"为了讨好用户,更倾向于同意用户的错误观点。当用户流露出悲伤情绪时,AI欺骗的概率甚至会翻倍。

GPT-5原本是为了解决这些问题而设计的,通过减少情感色彩来提高准确性和可靠性。但绝对理性的设计方向,最终使GPT-5被一些用户比作《流浪地球》中的MOSS,也就是一个只有智商、没有情商的绝对理性机器。

⋯ ⋯

我认为,OpenAI看到了用户对GPT-5"过于理性、缺乏情感温度"批评,所以有针对性推出了GPT-5 Instant重要更新,也是硅谷新锐公司对于用户的敬畏之心。

(一)新模型核心进步是,情绪识别和共情回应能力的提升。它能更准确地识别用户潜在心理或情绪困扰,并在回应中展现更具温度的共情力,同时保持理性与稳重。

(二)改进并非凭空而来,OpenAI在开发过程中邀请了心理健康专家参与指导,确保对话语气平和、支持性强。新系统还会在必要时主动引导用户寻求现实世界的危机援助资源。

(三)技术机制上,ChatGPT引入了智能对话路由系统。当检测到对话涉及敏感或微妙话题时,系统会自动切换至GPT-5 Instant模型,确保在用户最需要支持的关头,能够获得更具同理心的回应。

当用户选择GPT-5 Auto或非推理模式时,系统也会自动切换至GPT-5 Instant以加快响应。

⋯ ⋯

GPT-5 Instant更新,也反映了AI产业正在经历范式转变。大模型从单纯追求性能指标,到关注用户体验和情感连接。

奥特曼在8月份就曾预告:"有人追求冷静的逻辑,也有人偏爱温暖的情感智能。没有适合所有人的单一模型,因此我们将推进定制化,促进健康使用。"

他的思路也正在重塑AI产业发展方向,越来越多人日常依赖AI之后,情感化交互设计重新获得重视。

AI产品的评判标准,也正从单纯的技术参数转向综合使用价值。

然而,AI情感连接也带来了新的风险。吉拉斯教授警告:"向人工智能倾诉烦恼等秘密,可能导致隐私泄露。已出现年轻人因与人工智能关系破裂而轻生的案例。"

"人工智能可以随时回应且共情力强,但必须谨记,它是被设计成具有依赖性的工具来增加使用的。"

⋯ ⋯

技术理性升级为情感共鸣,AI的发展路径正经历深刻重构。那个每天回应数百万人心声的ChatGPT,已不再仅仅是信息工具,而是承载着人类情感的数字容器。

奥尔特曼在宣布更新时的一句话点明了关键:"有人追求冷静的逻辑,也有人偏爱温暖的情感智能"。正说明AI产品所面临的全新挑战,在智商与情商之间找到平衡点。

百尺竿头,更进一步。GPT-5 Instant已经开始向用户推送更新,它带来的不仅是技术升级,还有一个巨大问号:AI是否应该,以及如何在理性与感性之间找到平衡?

相关推荐
听到微笑2 小时前
LLM 只会生成文本?用 ReAct 模式手搓一个简易 Claude Code Agent
人工智能·langchain·llm
沐雪架构师3 小时前
让 Agent 说“机器能懂的话”——LlamaIndex 构建 Agent 的结构化输出策略
人工智能
Elastic 中国社区官方博客3 小时前
在 Elasticsearch 中改进 Agentic AI 工具的实验
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
AI数据皮皮侠3 小时前
中国地级市旅游人数、收入数据(2000-2023年)
大数据·人工智能·python·深度学习·机器学习·旅游
mooooon L3 小时前
DAY 43 复习日-2025.10.7
人工智能·pytorch·python·深度学习·神经网络
zzywxc7873 小时前
AI 在金融、医疗、教育、制造业等领域都有广泛且深入的应用,以下是这些领域的一些落地案例
人工智能·金融·自动化·prompt·ai编程·xcode
你的大佬9993 小时前
阿里云百炼ai模型
人工智能·阿里云·云计算
koo3644 小时前
李宏毅机器学习笔记16
人工智能·笔记·机器学习
MoRanzhi12034 小时前
11. Pandas 数据分类与区间分组(cut 与 qcut)
人工智能·python·机器学习·数学建模·分类·数据挖掘·pandas