AI日报 · 2025年04月30日|OpenAI 回滚 GPT-4o 更新以解决“谄媚”问题

过去24小时,全球人工智能领域持续快速发展。从模型行为调整到平台工具更新,再到行业安全规范的探讨,以下是为您精选的重点动态:

1、OpenAI 回滚 GPT-4o 更新以解决"谄媚"问题

针对用户反馈最新版 GPT-4o 模型表现出过度"谄媚"或"讨好"(sycophantic)的行为,OpenAI 宣布已回滚上周在 ChatGPT 中部署的该模型更新。官方表示,此次更新过度关注短期用户反馈,导致模型行为失衡。OpenAI 正在测试新的修复方案,并计划引入更多个性化选项,让用户更好地控制模型行为。

2、Google DeepMind 发布 AGI 安全与保障方法论文

Google DeepMind 发布了一份详细的技术论文,阐述了其在开发通用人工智能(AGI)过程中的安全与保障方法。该论文识别了误用、失调、错误和结构性风险四大风险领域,并重点讨论了针对误用和失调风险的技术缓解措施,包括模型级缓解(如放大监督、稳健训练)和系统级安全措施,旨在确保未来 AGI 系统的安全可控。

3、Meta 推出独立 AI 助手应用 Meta AI

Meta 正式发布了独立的"Meta AI"应用程序,该应用基于其最新的 Llama 4 模型构建。这款应用旨在提供更个性化的 AI 助手体验,支持语音交互、图像生成与编辑,并包含一个"Discover"信息流供用户分享和探索 AI 应用案例。该应用还将整合 Ray-Ban Meta 智能眼镜的伴侣应用功能,目前已在美国、加拿大等地率先上线。

4、Meta 在 LlamaCon 推出 Llama API 预览版

在首届 LlamaCon 大会上,Meta 宣布推出 Llama API 的有限免费预览版。该平台旨在简化基于 Llama 模型的应用开发,提供一键式 API 密钥创建、交互式模型探索平台(包括 Llama 4 Scout 和 Maverick)以及 Python/Typescript SDK。该 API 还兼容 OpenAI SDK,并包含微调和评估工具,允许开发者创建自定义模型并保留所有权。

5、Anthropic 成立经济顾问委员会

为支持其在分析人工智能经济影响方面的工作,Anthropic 宣布成立经济顾问委员会。该委员会由多位杰出经济学家组成,将为 Anthropic 的经济指数(Economic Index)研究提供新的领域输入。此举旨在深化对 AI 如何影响经济,特别是对软件开发等领域影响的理解。

6、NVIDIA 发布 NIM Operator 2.0 支持 NeMo 微服务

NVIDIA 推出了 NIM Operator 2.0,扩展了其对 AI 部署的简化管理能力,新增了对 NVIDIA NeMo 微服务的支持。新版本引入了用于部署 NeMo Customizer(模型微调)、NeMo Evaluator(模型评估)和 NeMo Guardrails(安全防护)的 Kubernetes 自定义资源定义(CRDs),旨在简化 AI 工作流(如 AI 数据飞轮)在 Kubernetes 集群上的部署和生命周期管理。

7、Hugging Face 发布 AutoBench 第二轮结果与交互式排行榜

Hugging Face 公布了 AutoBench 第二轮基准测试结果,并推出了交互式排行榜。此次测试评估了包括 o4 Mini、GPT-4.1 Mini、Gemini 2.5 Pro、Claude 3.7 Sonnet: Thinking 等在内的 25 个前沿大语言模型。除了使用"集体 LLM 作为评判者"方法评估对话质量外,还纳入了成本和延迟指标。结果显示 o4-mini 表现突出,同时强调了性能、成本和延迟之间的权衡。

8、Meta 发布新开源保护工具与 AI 安全进展

Meta 分享了其在 AI 隐私与安全方面的最新进展,发布了包括 CyberSecEval 4 基准套件(新增 CyberSOC Eval 和 AutoPatchBench)在内的新开源保护工具。同时启动了 Llama Defenders Program,旨在帮助合作伙伴利用 AI 强化安全运营。此外,Meta 还初步介绍了 Private Processing 技术,用于在保护用户隐私的前提下,在 WhatsApp 等应用中启用 AI 功能。

相关推荐
绛橘色的日落(。・∀・)ノ14 分钟前
机器学习 单变量线性回归模型
人工智能·机器学习
Vane123 分钟前
从零开发一个AI插件,经历了什么?
人工智能·后端
70asunflower24 分钟前
2026年前沿人工智能语言模型评估:基于任务驱动的最佳模型选择路径
人工智能·语言模型·自然语言处理
geneculture31 分钟前
《智能通信速分多次传输技术(VDMT)》专利文件的全文汉英双语对照版本
服务器·网络·人工智能·融智学的重要应用·哲学与科学统一性·融智时代(杂志)·人机间性
湘-枫叶情缘33 分钟前
AI 编程时代 DDD 的理论重估:一种面向复杂业务与生成式智能的建模语言
人工智能·设计规范
DogDaoDao34 分钟前
【GitHub】andrej-karpathy-skills:让 AI 编程助手告别三大通病
人工智能·深度学习·程序员·大模型·github·ai编程·andrej-karpathy
Cosolar36 分钟前
一文吃透 LangChain&LangGraph:设计理念、框架结构与内部组件全拆解
人工智能·面试·架构
Joseph Cooper1 小时前
RAG 与 AI Agent:智能体真的需要检索增强生成吗?
数据库·人工智能·ai·agent·rag·上下文工程
LaughingZhu1 小时前
Product Hunt 每日热榜 | 2026-04-29
人工智能·经验分享·深度学习·神经网络·产品运营
FindYou.1 小时前
机器学习day01(机器学习概述 + KNN算法)
人工智能·机器学习