AI日报 · 2025年04月30日|OpenAI 回滚 GPT-4o 更新以解决“谄媚”问题

过去24小时,全球人工智能领域持续快速发展。从模型行为调整到平台工具更新,再到行业安全规范的探讨,以下是为您精选的重点动态:

1、OpenAI 回滚 GPT-4o 更新以解决"谄媚"问题

针对用户反馈最新版 GPT-4o 模型表现出过度"谄媚"或"讨好"(sycophantic)的行为,OpenAI 宣布已回滚上周在 ChatGPT 中部署的该模型更新。官方表示,此次更新过度关注短期用户反馈,导致模型行为失衡。OpenAI 正在测试新的修复方案,并计划引入更多个性化选项,让用户更好地控制模型行为。

2、Google DeepMind 发布 AGI 安全与保障方法论文

Google DeepMind 发布了一份详细的技术论文,阐述了其在开发通用人工智能(AGI)过程中的安全与保障方法。该论文识别了误用、失调、错误和结构性风险四大风险领域,并重点讨论了针对误用和失调风险的技术缓解措施,包括模型级缓解(如放大监督、稳健训练)和系统级安全措施,旨在确保未来 AGI 系统的安全可控。

3、Meta 推出独立 AI 助手应用 Meta AI

Meta 正式发布了独立的"Meta AI"应用程序,该应用基于其最新的 Llama 4 模型构建。这款应用旨在提供更个性化的 AI 助手体验,支持语音交互、图像生成与编辑,并包含一个"Discover"信息流供用户分享和探索 AI 应用案例。该应用还将整合 Ray-Ban Meta 智能眼镜的伴侣应用功能,目前已在美国、加拿大等地率先上线。

4、Meta 在 LlamaCon 推出 Llama API 预览版

在首届 LlamaCon 大会上,Meta 宣布推出 Llama API 的有限免费预览版。该平台旨在简化基于 Llama 模型的应用开发,提供一键式 API 密钥创建、交互式模型探索平台(包括 Llama 4 Scout 和 Maverick)以及 Python/Typescript SDK。该 API 还兼容 OpenAI SDK,并包含微调和评估工具,允许开发者创建自定义模型并保留所有权。

5、Anthropic 成立经济顾问委员会

为支持其在分析人工智能经济影响方面的工作,Anthropic 宣布成立经济顾问委员会。该委员会由多位杰出经济学家组成,将为 Anthropic 的经济指数(Economic Index)研究提供新的领域输入。此举旨在深化对 AI 如何影响经济,特别是对软件开发等领域影响的理解。

6、NVIDIA 发布 NIM Operator 2.0 支持 NeMo 微服务

NVIDIA 推出了 NIM Operator 2.0,扩展了其对 AI 部署的简化管理能力,新增了对 NVIDIA NeMo 微服务的支持。新版本引入了用于部署 NeMo Customizer(模型微调)、NeMo Evaluator(模型评估)和 NeMo Guardrails(安全防护)的 Kubernetes 自定义资源定义(CRDs),旨在简化 AI 工作流(如 AI 数据飞轮)在 Kubernetes 集群上的部署和生命周期管理。

7、Hugging Face 发布 AutoBench 第二轮结果与交互式排行榜

Hugging Face 公布了 AutoBench 第二轮基准测试结果,并推出了交互式排行榜。此次测试评估了包括 o4 Mini、GPT-4.1 Mini、Gemini 2.5 Pro、Claude 3.7 Sonnet: Thinking 等在内的 25 个前沿大语言模型。除了使用"集体 LLM 作为评判者"方法评估对话质量外,还纳入了成本和延迟指标。结果显示 o4-mini 表现突出,同时强调了性能、成本和延迟之间的权衡。

8、Meta 发布新开源保护工具与 AI 安全进展

Meta 分享了其在 AI 隐私与安全方面的最新进展,发布了包括 CyberSecEval 4 基准套件(新增 CyberSOC Eval 和 AutoPatchBench)在内的新开源保护工具。同时启动了 Llama Defenders Program,旨在帮助合作伙伴利用 AI 强化安全运营。此外,Meta 还初步介绍了 Private Processing 技术,用于在保护用户隐私的前提下,在 WhatsApp 等应用中启用 AI 功能。

相关推荐
AI大模型2 小时前
LangGraph官方文档笔记(七)——Agent的输入输出
langchain·llm·agent
麻雀无能为力2 小时前
CAU数据挖掘实验 表分析数据插件
人工智能·数据挖掘·中国农业大学
时序之心2 小时前
时空数据挖掘五大革新方向详解篇!
人工智能·数据挖掘·论文·时间序列
.30-06Springfield3 小时前
人工智能概念之七:集成学习思想(Bagging、Boosting、Stacking)
人工智能·算法·机器学习·集成学习
说私域4 小时前
基于开源AI智能名片链动2+1模式S2B2C商城小程序的超级文化符号构建路径研究
人工智能·小程序·开源
永洪科技4 小时前
永洪科技荣获商业智能品牌影响力奖,全力打造”AI+决策”引擎
大数据·人工智能·科技·数据分析·数据可视化·bi
shangyingying_14 小时前
关于小波降噪、小波增强、小波去雾的原理区分
人工智能·深度学习·计算机视觉
书玮嘎5 小时前
【WIP】【VLA&VLM——InternVL系列】
人工智能·深度学习
猫头虎5 小时前
猫头虎 AI工具分享:一个网页抓取、结构化数据提取、网页爬取、浏览器自动化操作工具:Hyperbrowser MCP
运维·人工智能·gpt·开源·自动化·文心一言·ai编程
要努力啊啊啊6 小时前
YOLOv2 正负样本分配机制详解
人工智能·深度学习·yolo·计算机视觉·目标跟踪