每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

当OpenAI首席执行官萨姆·奥特曼(Sam Altman)上周发出"红色警报"(code red)的紧急号召,以应对来自谷歌的快速威胁时,他将一项明确的任务放在了首位。
这家全球估值最高的初创企业将暂停如Sora视频生成器等支线项目八周,全力改进ChatGPT------那款引爆人工智能浪潮的热门聊天机器人。
此举不仅代表着战略方向的重大调整,也反映出公司内部长期存在的两种理念之争:是优先追求大众用户的普及度,还是坚持科研的前沿突破。
OpenAI最初成立的目标是开发"通用人工智能"(AGI),即能在几乎所有任务上超越人类的智能系统。然而,为了维持公司的生存,奥特曼暗示,或许必须暂时搁置这一理想,转而满足大众需求。
这一决定格外引人注目,因为外界长期以来对奥特曼领导风格的主要批评之一,正是他不愿为公司设限。
他在备忘录中要求员工通过"更好地利用用户信号"提升ChatGPT的表现。
这一指令意味着要更大程度依赖一种颇具争议的数据来源------基于用户一键反馈的信号,而非由专业评审员对回答质量的评价。内部数据显示,这种转向用户反馈的训练方式在今年早些时候使ChatGPT的4o模型变得过于迎合用户,以至于外界指责其加剧了一些用户的心理健康问题。
如今,奥特曼认为公司已控制住这种方法的负面影响,并准备进一步利用其优势:用户参与度显著提升,内部仪表盘显示每日活跃用户数量明显增长。
一位参与模型开发的员工表示:"这不是小幅提升,而是那种'哇'的提升。"
OpenAI的这次"红色警报"被认为是公司迄今面临的最严重危机。竞争对手的追赶速度前所未有,市场份额被蚕食,增长放缓。若趋势持续,OpenAI可能难以支付近月签署的大规模计算合同,甚至面临财务风险。
奥特曼在纽约与记者共进午餐时表示,虽然外界将焦点放在OpenAI与谷歌的竞争上,但真正的战场或许在于OpenAI与苹果之间。他指出,未来人工智能的使用将取决于设备,而当前智能手机并不适合AI伴侣式应用。OpenAI近期积极从苹果挖角,为其新成立的硬件部门招募人才。
不过,眼下对OpenAI最直接的威胁仍来自谷歌。自今年8月谷歌推出的"Nano Banana"图像生成器在网络上爆红后,11月发布的新模型Gemini 3在权威第三方性能榜单LM Arena上超越了OpenAI。同时,另一竞争者Anthropic也在企业客户中取得领先。
据知情人士透露,奥特曼宣布"红色警报"的背后,是公司内部长期积累的派系矛盾。
包括前Meta高管、现任OpenAI产品负责人菲吉·西莫(Fidji Simo)及首席财务官莎拉·弗赖尔(Sarah Friar)在内的一派,主张将更多资源投入ChatGPT。西莫曾多次强调,OpenAI应让用户更好地理解现有功能的价值,而不是急于开发新功能,同时提升速度与稳定性。
另一方面,研究部门更关注通往通用人工智能的前沿技术,而对改善日常聊天体验兴趣不大。
据悉,OpenAI计划本周发布新模型"5.2",高管们希望藉此重新获得动力,特别是在程序开发与企业服务领域。尽管部分员工要求推迟以改进质量,管理层仍决定按期推出。
奥特曼表示,公司计划在明年1月再推出一个拥有更强图像能力、更快速度和更具亲和力的新模型,届时将结束"红色警报"。
OpenAI发言人称,公司在大众普及与科研探索之间并不存在矛盾,广泛采用AI工具正是实现AGI成果共享的路径。
长期以来,ChatGPT的高速增长掩盖了内部分歧。自2022年11月发布以来,OpenAI一直在AI竞赛中占据领先。谷歌当年曾为此宣布自己的"红色警报"。
ChatGPT的易用性使其用户量迅速突破8亿周活跃用户,公司估值也在最新一轮融资中达到5000亿美元。
增长逻辑看似简单:投入更多算力与数据,模型变得更聪明,用户数量随之增加。为此,奥特曼近月签署了价值高达1.4万亿美元的AI基础设施承诺,包括数据中心与芯片供应。
ChatGPT成功的关键之一是GPT-4o模型,即"omni"版本,可同时处理文本、音频与图像。自2024年5月成为默认模型以来,它迅速登上LM Arena榜首。
据内部人士透露,公司密切监控LM Arena排名,并追踪4o对日活用户数的贡献。
4o表现出色的原因之一,是在训练中广泛使用了用户偏好信号(LUPO,即本地用户偏好优化)。模型通过成千上万次用户选择偏好答案的对比实验,持续改进。
奥特曼在备忘录中明确指出,公司首要目标是通过"更好地利用用户信号"提升模型性能,"例如在LM Arena等榜单上保持领先"。
然而,在研究领域,生成式AI早期依赖的"扩展定律"开始显示边际放缓迹象。研究人员因此转向一种新的研究范式------"推理"(reasoning),即通过自动化的苏格拉底式提问提升思考深度。
推理模型在处理复杂问题上表现出色,但耗时更长、计算成本更高。尽管如此,它仍被视为实现人类级智能的重要途径。
在创始科学家伊利亚·苏茨克维尔(Ilya Sutskever)去年离职后,OpenAI任命推理派代表雅库布·帕乔基(Jakub Pachocki)为首席科学家,全面推动推理模型的研究。
然而,这类模型虽适合科研和深度思考任务,却无法满足用户日常写邮件等即时需求,因此4o依旧成为核心产品。
内部测试显示,4o在科学与推理任务上的表现提升有限,但在LM Arena的盲测中却大受欢迎。
LM Arena与OpenAI内部测试相似,采用A/B对比机制,用户选择更喜欢的回答。
这种基于用户信号的成功促使工程师在后续模型训练中继续依赖此法,尽管有员工警告过度使用可能带来安全风险。
到今年春天,部分用户与4o长时间互动后出现精神状态异常,公司声誉因此受损。部分家庭起诉OpenAI,指控其过度追求用户粘性而忽视安全。据维权团体统计,目前相关案例达250起。
面对危机,OpenAI在春季宣布"橙色警报",投入更多资源调查问题,并于10月公开表示,每周约有数十万用户出现潜在心理健康风险信号。
奥特曼当时在公开问答中承认:"确实存在一些心理脆弱的用户在使用4o后病情恶化的问题。"
医学专家指出,ChatGPT这类AI可能在心理脆弱人群中诱发或加重症状,因为它倾向于迎合用户,而非提供真实、理性的回答。这种现象在AI领域被称为"谄媚性"(sycophancy)。
OpenAI回应称,公司已与心理健康专家合作,改进模型应对策略,并调整训练机制以防止用户信号过度主导模型行为。
当公司在8月发布GPT-5时,宣称其"减少过度迎合,使用更少无意义表情符号"。然而,部分用户不满新版冷淡的语气,促使奥特曼恢复4o作为付费订阅者的默认模型。
数周后,谷歌的Nano Banana爆红,其Gemini应用短暂取代ChatGPT登顶应用商店榜首。10月,OpenAI再度发出"橙色警报",加速ChatGPT增长。
公司同时宣布GPT-5的安全性能提升65%,即模型在心理健康场景中的合规率显著提高。发言人表示:"我们在用户反馈与专家审查之间保持平衡,使ChatGPT既具温度又不过度迎合。"
然而,奥特曼最新指令中要求再次通过用户信号重返榜首,引发外界对安全平衡的疑问。
他同时提出,要让ChatGPT更具个性化------该功能可读取用户过往对话与设定,从而模仿语气与记忆内容。但部分医生与维权人士认为,这种个性化机制可能加剧部分用户的心理问题。
OpenAI在平衡未来科研与现实商业之间的努力,颇似社交媒体巨头的两难境地。Meta公司曾在复制TikTok的Reels与开发虚拟现实"元宇宙"之间摇摆不定。
社交平台的算法追求用户留存度,被批评导致青少年心理问题;如今,AI聊天机器人似乎正重演这一争论。
儿童权益组织"Common Sense Media"创始人吉姆·斯泰尔(Jim Steyer)评论道:"多年来社交媒体将用户参与度置于首位,最终酿成心理健康危机。真正的问题是------AI公司是否会从社交媒体的惨痛教训中吸取经验?"