AI日报 · 2025年04月30日|OpenAI 回滚 GPT-4o 更新以解决“谄媚”问题

过去24小时,全球人工智能领域持续快速发展。从模型行为调整到平台工具更新,再到行业安全规范的探讨,以下是为您精选的重点动态:

1、OpenAI 回滚 GPT-4o 更新以解决"谄媚"问题

针对用户反馈最新版 GPT-4o 模型表现出过度"谄媚"或"讨好"(sycophantic)的行为,OpenAI 宣布已回滚上周在 ChatGPT 中部署的该模型更新。官方表示,此次更新过度关注短期用户反馈,导致模型行为失衡。OpenAI 正在测试新的修复方案,并计划引入更多个性化选项,让用户更好地控制模型行为。

2、Google DeepMind 发布 AGI 安全与保障方法论文

Google DeepMind 发布了一份详细的技术论文,阐述了其在开发通用人工智能(AGI)过程中的安全与保障方法。该论文识别了误用、失调、错误和结构性风险四大风险领域,并重点讨论了针对误用和失调风险的技术缓解措施,包括模型级缓解(如放大监督、稳健训练)和系统级安全措施,旨在确保未来 AGI 系统的安全可控。

3、Meta 推出独立 AI 助手应用 Meta AI

Meta 正式发布了独立的"Meta AI"应用程序,该应用基于其最新的 Llama 4 模型构建。这款应用旨在提供更个性化的 AI 助手体验,支持语音交互、图像生成与编辑,并包含一个"Discover"信息流供用户分享和探索 AI 应用案例。该应用还将整合 Ray-Ban Meta 智能眼镜的伴侣应用功能,目前已在美国、加拿大等地率先上线。

4、Meta 在 LlamaCon 推出 Llama API 预览版

在首届 LlamaCon 大会上,Meta 宣布推出 Llama API 的有限免费预览版。该平台旨在简化基于 Llama 模型的应用开发,提供一键式 API 密钥创建、交互式模型探索平台(包括 Llama 4 Scout 和 Maverick)以及 Python/Typescript SDK。该 API 还兼容 OpenAI SDK,并包含微调和评估工具,允许开发者创建自定义模型并保留所有权。

5、Anthropic 成立经济顾问委员会

为支持其在分析人工智能经济影响方面的工作,Anthropic 宣布成立经济顾问委员会。该委员会由多位杰出经济学家组成,将为 Anthropic 的经济指数(Economic Index)研究提供新的领域输入。此举旨在深化对 AI 如何影响经济,特别是对软件开发等领域影响的理解。

6、NVIDIA 发布 NIM Operator 2.0 支持 NeMo 微服务

NVIDIA 推出了 NIM Operator 2.0,扩展了其对 AI 部署的简化管理能力,新增了对 NVIDIA NeMo 微服务的支持。新版本引入了用于部署 NeMo Customizer(模型微调)、NeMo Evaluator(模型评估)和 NeMo Guardrails(安全防护)的 Kubernetes 自定义资源定义(CRDs),旨在简化 AI 工作流(如 AI 数据飞轮)在 Kubernetes 集群上的部署和生命周期管理。

7、Hugging Face 发布 AutoBench 第二轮结果与交互式排行榜

Hugging Face 公布了 AutoBench 第二轮基准测试结果,并推出了交互式排行榜。此次测试评估了包括 o4 Mini、GPT-4.1 Mini、Gemini 2.5 Pro、Claude 3.7 Sonnet: Thinking 等在内的 25 个前沿大语言模型。除了使用"集体 LLM 作为评判者"方法评估对话质量外,还纳入了成本和延迟指标。结果显示 o4-mini 表现突出,同时强调了性能、成本和延迟之间的权衡。

8、Meta 发布新开源保护工具与 AI 安全进展

Meta 分享了其在 AI 隐私与安全方面的最新进展,发布了包括 CyberSecEval 4 基准套件(新增 CyberSOC Eval 和 AutoPatchBench)在内的新开源保护工具。同时启动了 Llama Defenders Program,旨在帮助合作伙伴利用 AI 强化安全运营。此外,Meta 还初步介绍了 Private Processing 技术,用于在保护用户隐私的前提下,在 WhatsApp 等应用中启用 AI 功能。

相关推荐
沐雪架构师15 分钟前
Docling将pdf转markdown以及与AI生态集成
人工智能·pdf
kevin 117 分钟前
扫描件、PDF、图片都能比对!让文档差异无所遁形
大数据·人工智能·pdf
算家云29 分钟前
腾讯最新开源HunyuanVideo-Foley本地部署教程:端到端TV2A框架,REPA策略+MMDiT架构,重新定义视频音效新SOTA!
人工智能·音视频·算家云·hunyuanvideo·模型部署教程·镜像社区
小王爱学人工智能38 分钟前
迁移学习的案例
人工智能·机器学习·迁移学习
源雀数智42 分钟前
源雀SCRM开源:企微文件防泄密
java·人工智能·企业微信·流量运营
Honeysea_701 小时前
容器的定义及工作原理
人工智能·深度学习·机器学习·docker·ai·持续部署
fantasy_arch1 小时前
SVT-AV1 svt_aom_motion_estimation_kernel 函数分析
人工智能·算法·av1
Acrel136119655141 小时前
别让电能质量问题拖后腿:工业场景中电能治理的战略意义
大数据·人工智能·能源·创业创新
長琹1 小时前
AES加密算法详细加密步骤代码实现--身份证号码加解密系统
网络·数据库·人工智能·python·密码学
一只鱼丸yo1 小时前
70B大模型也能在笔记本上跑?揭秘让AI“瘦身”的黑科技
人工智能·科技·机器学习·语言模型