AI日报 · 2025年04月30日|OpenAI 回滚 GPT-4o 更新以解决“谄媚”问题

过去24小时,全球人工智能领域持续快速发展。从模型行为调整到平台工具更新,再到行业安全规范的探讨,以下是为您精选的重点动态:

1、OpenAI 回滚 GPT-4o 更新以解决"谄媚"问题

针对用户反馈最新版 GPT-4o 模型表现出过度"谄媚"或"讨好"(sycophantic)的行为,OpenAI 宣布已回滚上周在 ChatGPT 中部署的该模型更新。官方表示,此次更新过度关注短期用户反馈,导致模型行为失衡。OpenAI 正在测试新的修复方案,并计划引入更多个性化选项,让用户更好地控制模型行为。

2、Google DeepMind 发布 AGI 安全与保障方法论文

Google DeepMind 发布了一份详细的技术论文,阐述了其在开发通用人工智能(AGI)过程中的安全与保障方法。该论文识别了误用、失调、错误和结构性风险四大风险领域,并重点讨论了针对误用和失调风险的技术缓解措施,包括模型级缓解(如放大监督、稳健训练)和系统级安全措施,旨在确保未来 AGI 系统的安全可控。

3、Meta 推出独立 AI 助手应用 Meta AI

Meta 正式发布了独立的"Meta AI"应用程序,该应用基于其最新的 Llama 4 模型构建。这款应用旨在提供更个性化的 AI 助手体验,支持语音交互、图像生成与编辑,并包含一个"Discover"信息流供用户分享和探索 AI 应用案例。该应用还将整合 Ray-Ban Meta 智能眼镜的伴侣应用功能,目前已在美国、加拿大等地率先上线。

4、Meta 在 LlamaCon 推出 Llama API 预览版

在首届 LlamaCon 大会上,Meta 宣布推出 Llama API 的有限免费预览版。该平台旨在简化基于 Llama 模型的应用开发,提供一键式 API 密钥创建、交互式模型探索平台(包括 Llama 4 Scout 和 Maverick)以及 Python/Typescript SDK。该 API 还兼容 OpenAI SDK,并包含微调和评估工具,允许开发者创建自定义模型并保留所有权。

5、Anthropic 成立经济顾问委员会

为支持其在分析人工智能经济影响方面的工作,Anthropic 宣布成立经济顾问委员会。该委员会由多位杰出经济学家组成,将为 Anthropic 的经济指数(Economic Index)研究提供新的领域输入。此举旨在深化对 AI 如何影响经济,特别是对软件开发等领域影响的理解。

6、NVIDIA 发布 NIM Operator 2.0 支持 NeMo 微服务

NVIDIA 推出了 NIM Operator 2.0,扩展了其对 AI 部署的简化管理能力,新增了对 NVIDIA NeMo 微服务的支持。新版本引入了用于部署 NeMo Customizer(模型微调)、NeMo Evaluator(模型评估)和 NeMo Guardrails(安全防护)的 Kubernetes 自定义资源定义(CRDs),旨在简化 AI 工作流(如 AI 数据飞轮)在 Kubernetes 集群上的部署和生命周期管理。

7、Hugging Face 发布 AutoBench 第二轮结果与交互式排行榜

Hugging Face 公布了 AutoBench 第二轮基准测试结果,并推出了交互式排行榜。此次测试评估了包括 o4 Mini、GPT-4.1 Mini、Gemini 2.5 Pro、Claude 3.7 Sonnet: Thinking 等在内的 25 个前沿大语言模型。除了使用"集体 LLM 作为评判者"方法评估对话质量外,还纳入了成本和延迟指标。结果显示 o4-mini 表现突出,同时强调了性能、成本和延迟之间的权衡。

8、Meta 发布新开源保护工具与 AI 安全进展

Meta 分享了其在 AI 隐私与安全方面的最新进展,发布了包括 CyberSecEval 4 基准套件(新增 CyberSOC Eval 和 AutoPatchBench)在内的新开源保护工具。同时启动了 Llama Defenders Program,旨在帮助合作伙伴利用 AI 强化安全运营。此外,Meta 还初步介绍了 Private Processing 技术,用于在保护用户隐私的前提下,在 WhatsApp 等应用中启用 AI 功能。

相关推荐
想用offer打牌7 分钟前
一站式了解Spring AI Alibaba的流式输出
java·人工智能·后端
黑符石15 分钟前
【论文研读】Madgwick 姿态滤波算法报告总结
人工智能·算法·机器学习·imu·惯性动捕·madgwick·姿态滤波
JQLvopkk21 分钟前
智能AI“学习功能”在程序开发部分的逻辑
人工智能·机器学习·计算机视觉
我的offer在哪里23 分钟前
Hugging Face:让大模型触手可及的魔法工厂
人工智能·python·语言模型·开源·ai编程
收获不止数据库23 分钟前
黄仁勋2026CES演讲复盘:旧世界,裂开了!
大数据·数据库·人工智能·职场和发展
老胡全房源系统24 分钟前
房产中介管理系统哪一款性价比高
大数据·人工智能·房产经纪人培训
黄焖鸡能干四碗32 分钟前
信息安全网络安全评估报告(WORD)
大数据·网络·人工智能·安全·web安全·制造·需求分析
职业码农NO.143 分钟前
AI 技术栈完整解析,从 GPU 到应用的五层架构
人工智能·架构·系统架构·aigc·agent
小烤箱1 小时前
Autoware Universe 感知模块详解 | 第十一节:检测管线的通用工程模板与拆解思路导引
人工智能·机器人·自动驾驶·autoware·感知算法