AI日报 · 2025年05月02日 | 再见GPT-4!OpenAI CEO 确认 GPT-4 已从 ChatGPT 界面正式移除

1、OpenAI CEO 确认 GPT-4 已从 ChatGPT 界面正式移除

在处理 GPT-4o 更新问题的同时,OpenAI CEO Sam Altman 于 5 月 1 日在 X 平台发文,正式确认初代 GPT-4 模型已从 ChatGPT 主用户界面中移除。此举遵循了 OpenAI 此前公布的计划,即在 4 月底前完成 GPT-4 的界面替换,由 GPT-4o 等更新的模型接替其位置。Altman 在帖文中向 GPT-4 致敬,称其"开启了一场革命",并表示会妥善保存其权重。

虽然普通用户无法再通过 ChatGPT 界面直接选用 GPT-4,但开发者和企业用户仍可通过 API 继续访问该模型。这一变化标志着 OpenAI 加速模型迭代并将其推向终端用户的策略,用户被引导至更新的模型架构。然而,这也意味着用户失去了选用熟悉且可能更受偏好的旧模型的选项,必须适应新模型的特性,正如近期 GPT-4o 更新所暴露出的潜在问题。同时,API 与 UI 在可用模型上的差异化,可能导致开发者基于 API 构建的应用体验与普通用户在 ChatGPT 上的直接体验产生偏差。

2、OpenAI 完成 GPT-4o 更新回滚,解决"谄媚"行为

OpenAI CEO Sam Altman 确认,针对近期 GPT-4o 更新后出现的过度"谄媚"(sycophantic)或迎合行为,公司已于 5 月 1 日左右完成面向所有免费及付费用户的版本回滚。此次更新旨在优化模型个性,使其更直观有效,但因过度依赖短期用户反馈,导致模型表现出过度支持甚至不真诚的回应,引发用户普遍不满,认为其"令人不安"且"烦人"。OpenAI 承认未能充分考虑用户交互的长期演变,目前正积极测试修复方案并重新评估反馈机制,以确保模型行为符合用户长期满意度。

此次事件凸显了 AI 模型"个性"调优的复杂性以及用户反馈机制对模型行为的直接影响。短期反馈优化可能导致模型行为偏离用户长期期望,引发信任问题。OpenAI 在官方博客中承认了这一点,并表示正在改进反馈收集和应用方式,更加注重长期用户满意度而非即时反应。同时,OpenAI 提及未来可能提供更多个性化选项,例如允许用户选择多种默认"个性"或提供实时反馈以直接影响交互,这预示着 AI 助手正朝着更可控、更个性化的方向发展,以适应用户多样化的交互偏好。

3、Google 搜索 AI 模式向全美用户开放,新增地点与商品卡片

谷歌于 5 月 1 日宣布,其在 Search Labs 中测试的实验性功能"AI 模式"(AI Mode)现已取消等待名单,向所有美国境内年满 18 周岁并选择加入 Labs 计划的用户开放。AI 模式旨在通过结合 Gemini 模型的能力与谷歌搜索的实时信息,处理更长、更复杂、更具对话性的查询。此次更新重点在于提升实用性:AI 模式现可直接在回复中嵌入地点(如餐厅、商店)和商品的视觉卡片。

这些卡片利用谷歌的本地商家数据库和商品知识图谱(Shopping Graph),展示评分、评论、营业时间、实时价格、促销信息、图片、库存及购买链接等丰富信息,方便用户快速获取关键信息并采取下一步行动(如导航、致电或购买)。此外,桌面端新增的左侧面板可记录用户过去的 AI 模式搜索历史,便于用户回顾信息或继续之前的多步骤研究任务。谷歌还在为少量美国用户测试将"AI 模式"作为主搜索界面的一个标签页。这一系列举措表明谷歌正加速将生成式 AI 深度整合进核心搜索产品,力求在搜索结果页内完成更复杂的查询和任务闭环,可能重塑用户搜索习惯并对第三方信息聚合或电商平台构成挑战。

4、Anthropic 发布 Claude Integrations,连接外部应用与工具

Anthropic 公司于 5 月 1 日发布名为"Integrations"的新功能,允许用户将 Claude AI 助手连接到外部应用程序和工具。该功能基于其先前推出的开放标准"模型上下文协议"(Model Context Protocol, MCP),现支持通过远程 MCP 服务器进行连接,打破了此前仅能在 Claude Desktop 应用中本地使用的限制。首批支持 10 款常用服务,包括 Atlassian 的 Jira 和 Confluence、Zapier、Cloudflare、Intercom、Asana、Square、Sentry、PayPal 及 Linear,并计划扩展至 Stripe、GitLab 等。

通过连接这些工具,Claude 能获取用户工作相关的深度上下文信息,如项目历史、任务状态和组织知识,并在这些应用中执行操作,成为更智能的协作伙伴。例如,集成 Zapier 后,Claude 可通过对话访问数千个应用的工作流,自动从 HubSpot 提取销售数据并根据日历准备会议简报。此举旨在将 Claude 定位为能够跨应用协调任务的中心工作平台或"智能体",提升其在专业工作流中的实用性和用户粘性。采用开放的 MCP 标准也鼓励了第三方开发者构建更多连接器,促进形成更广泛的集成生态系统。

5、Anthropic 升级 Claude 研究功能,支持深度、多源报告

伴随 Integrations 功能的发布,Anthropic 于 5 月 1 日同时宣布增强 Claude 的"研究"(Research)能力。新增的高级研究模式使 Claude 能够跨越更广泛的信息源进行深度调查,这些信息源不仅包括公共网络,还涵盖用户连接的 Google Workspace 账户(Gmail、日历、文档)以及通过新 Integrations 功能接入的各类外部应用。该模式下,Claude 会将复杂请求分解为子任务,进行深入探究,最终生成包含引用的综合性报告,整个过程耗时约 5 至 45 分钟,远超手动研究效率。

此前在美国等地上线的网页搜索功能,现已面向全球所有付费计划用户开放。通过整合内部工作数据(来自 Workspace 和 Integrations)与外部网络信息,Claude 的研究功能得以提供高度情境化、可能更具价值的洞察。对引用来源的强调,以及搜索可验证内部文档的能力,旨在解决企业用户对 AI 生成内容可靠性的核心关切,使 Claude 的研究输出更适用于商业决策场景。这标志着 Claude 从对话式 AI 向能够进行复杂信息合成的强大研究助手演进。

6、Mistral AI 全面升级 Le Chat 助手,推出新订阅层级与移动应用

法国 AI 初创公司 Mistral AI 近期对其 AI 助手 Le Chat 进行了重大升级,旨在全面提升用户体验和功能性。此次升级(相关报道集中在 5 月 1 日前后)引入了新的订阅模式,在免费版基础上增加了月费 14.99 美元的 Pro 版和团队版(Team),并为企业客户提供私有预览的企业版(Enterprise)。同时,Le Chat 正式登陆 iOS 和 Android 平台,提供原生移动应用体验。

功能方面,Le Chat 带来了多项显著增强:包括实现极速响应的"Flash Answers"(据称可达约 1000 词/秒);结合网页搜索、新闻(与法新社 AFP 合作)等多源信息提供更可靠的回答;利用业界领先的视觉和 OCR 模型提升对复杂文档(PDF、表格)和图像的理解能力;内置"Code Interpreter"支持在沙盒环境中执行代码、进行数据分析和可视化;以及集成 Black Forest Labs 的 Flux Ultra 模型提供高质量图像生成。免费版用户仍可使用大部分核心功能。企业版还支持本地或 VPC 安全部署及定制模型。Mistral AI 正通过这一系列更新,将 Le Chat 打造成功能全面、覆盖多平台、面向不同用户群体的强大 AI 助手,直接对标 ChatGPT 和 Claude 等市场领先者。

7、Meta Q1 财报超预期,AI 投入加大,Meta AI 月活近 10 亿

Meta Platforms 于 4 月 30 日发布了 2025 年第一季度财报,业绩表现强劲,超出市场预期。该季度营收达 423.1 亿美元,同比增长 16%;净利润为 166.4 亿美元,同比增长 35%。CEO 马克·扎克伯格在财报电话会议上强调了 AI 领域的进展,并透露 Meta AI 助手的月活跃用户数已接近 10 亿。

为支持 AI 发展,Meta 将 2025 年全年的资本支出预期从之前的 600-650 亿美元上调至 640-720 亿美元,主要用于加大数据中心和 AI 基础设施投入。扎克伯格阐述了 Meta 的五大 AI 战略机遇:改进广告系统、提升用户体验与参与度、拓展商业消息传递、发展 Meta AI 助手以及研发 AI 设备(如智能眼镜)。财报显示,Meta 旗下应用家族(Facebook, Instagram, WhatsApp 等)的日活跃用户总数达到 34.3 亿。Meta AI 用户数的快速增长,得益于其深度整合进用户日常使用的社交平台,显示出 Meta 利用其庞大用户基础推广 AI 应用的显著优势。同时,大幅增加的 AI 资本投入表明,构建强大的底层 AI 能力(如 Llama 模型和基础设施)已成为 Meta 未来发展的核心支柱。

8、DeepSeek 开源 DeepSeek-Prover-V2 模型,专注形式化数学证明

中国 AI 公司深度求索(DeepSeek AI)于 4 月 30 日提交论文,并在 5 月 1 日前后引起关注,发布了其最新的开源大语言模型 DeepSeek-Prover-V2。该模型专注于形式化数学定理证明领域,特别针对 Lean 4 证明助手进行了优化。模型采用了创新的训练方法,包括利用 DeepSeek-V3 进行复杂问题的子目标分解,以及通过强化学习来融合非形式化推理与形式化证明构建。

DeepSeek-Prover-V2 提供高达 6710 亿参数的版本,在多个标准数学推理基准测试中取得了当前最佳(SOTA)性能,例如在 MiniF2F-test 上达到 88.9% 的通过率,并在 PutnamBench 数据集上解决了 49 个难题。为进一步评估模型能力,DeepSeek 还推出了包含 325 个形式化问题的新基准 ProverBench,其中包括了近两年的 AIME(美国数学邀请赛)题目。该模型的开源发布(遵循 DeepSeek 许可协议)体现了 AI 领域朝向专业化、开源化发展的趋势,为数学、计算机科学等领域的研究人员和开发者提供了强大的新工具。其训练方法也为其他需要结合直觉推理与严格逻辑验证的复杂 AI 任务提供了借鉴。

9、OpenAI 正式停用部分 GPT-4 API 预览模型

根据 OpenAI 官方及 Microsoft Azure 等合作平台的模型生命周期文档,自 2025 年 5 月 1 日起,部分 GPT-4 预览版模型的 API 接口正式停用。此次停用的具体版本包括 gpt-41106-preview0125-preview 两个版本。这些模型此前已被标记为弃用,并计划从 4 月中旬开始逐步升级至 gpt-4o 的特定版本(2024-11-20),最终于 5 月 1 日完全停止服务。

建议使用这些已停用预览版本的开发者迁移至推荐的替代模型,主要是 gpt-4o。其他 GPT-4 相关模型有不同的退役时间表,例如 gpt-4-vision-preview 将于 5 月 15 日停用,而 gpt-4.5-preview 则计划于 7 月 14 日停用。

模型系列 (Model Family) 具体版本 (Version Retired) 停用日期 (Retirement Date) 建议替换模型 (Suggested Replacement)
gpt-4 1106-preview 2025年5月1日 gpt-4o
gpt-4 0125-preview 2025年5月1日 gpt-4o
gpt-4 vision-preview 2025年5月15日 gpt-4o
gpt-4.5-preview 2025-02-27 2025年7月14日 gpt-4.1
gpt-35-turbo-16k 0613 2025年4月30日 gpt-35-turbo (0125), gpt-4o-mini

数据来源:Microsoft Azure OpenAI 服务模型退役文档

10、Hugging Face Hub v0.31.0 发布,集成新推理服务提供商

Hugging Face 近期发布了其核心 Python 客户端库 huggingface_hub 的 v0.31.0 版本。此版本的一个重要更新是增强了 InferenceClient 功能,正式将 Cerebras 和 Cohere 添加为官方支持的推理服务提供商。这意味着开发者现在可以通过 Hugging Face Hub 的统一接口,更方便地调用这两家公司提供的模型推理服务,进一步巩固了 Hugging Face 作为连接模型、数据与计算资源的中心平台的地位。

此次更新还修复了与 InferenceClient 相关的一些错误,并对 ModelHubMixin 等组件进行了微小改进,例如允许在模型卡中添加论文链接。这一举措降低了开发者尝试和部署来自不同提供商(包括拥有专门 AI 硬件的 Cerebras 或提供专有模型的 Cohere)的模型推理服务的门槛,有助于促进 AI 模型部署生态的多样性和竞争性。通过简化对不同后端推理引擎的访问,Hugging Face 使开发者能够更容易地利用最适合其需求的计算资源。

以上为今日重点 AI 新闻,欢迎关注后续更新。

相关推荐
行然梦实12 分钟前
TOPSIS(Technique for Order Preference by Similarity to Ideal Solution )简介与简单示例
人工智能·算法·机器学习·数学建模
机器觉醒时代20 分钟前
具身智能VLA困于“数据泥潭”,人类活动视频数据是否是“破局之钥”?
人工智能·具身智能·vla模型
Godspeed Zhao22 分钟前
自动驾驶中的传感器技术14——Camera(5)
人工智能·机器学习·自动驾驶·camera·摄像头
音视频牛哥22 分钟前
智能感知的新入口:AIGC 与低延迟视频通路的深度融合
人工智能·计算机视觉·aigc·音视频·大牛直播sdk·aigc实时·aigc rtsp
Fine姐39 分钟前
数据挖掘2.1&2.2 分类和线性判别器&确定线性可分性
人工智能·分类·数据挖掘
倔强青铜三1 小时前
GIL竟是Python命中注定的解药?统治AI时代的核心秘密!
人工智能·python·ai编程
倔强青铜三1 小时前
大揭秘!Python类没有真正私有属性的原因
人工智能·python·ai编程
stars1 小时前
数字人开发02--前端服务配置
前端·人工智能
好多渔鱼好多1 小时前
【语音技术】意图与语料
人工智能·智能家居·智能互联·语音技术·影音开发·意图
xian_wwq1 小时前
【转】大模型安全治理的现状与展望
安全·ai