数据来源:搜狐、新浪、腾讯网、CSDN、中关村在线、企鹅号、IT之家、东方财富网等 简报日期:2026年5月28日
📊 本周总览
| 指标 | 数据 |
|---|---|
| 本周重大事件数量 | 20+ |
| 核心主题 | 大模型军备竞赛、国产AI千亿融资狂潮、全球价格战、Agent监管政策、AI商业化拐点 |
| 最大融资 | DeepSeek 700亿元(估值3500亿元),月之暗面20亿美元(估值200亿美元) |
| 最大发布 | 谷歌Gemini 3.5 Flash(I/O 2026)、DeepSeek-V4-Pro API永久降价75% |
| 最重要政策 | 《智能体规范应用与创新发展实施意见》发布 |
| 最大人事变动 | Andrej Karpathy 加入 Anthropic |
一、🔥 大模型军备竞赛
1. 谷歌 I/O 2026 --- Gemini 3.5 Flash 发布(5月20日)
发布会概况:
| 项目 | 内容 |
|---|---|
| 大会名称 | Google I/O 2026 |
| 时间 | 2026年5月20日 |
| 地点 | 山景城海岸线剧场 |
| 核心发布 | Gemini 3.5 Flash |
| Gemini月活用户 | 超过9亿 |
Gemini 3.5 Flash 核心参数:
| 指标 | 数据 |
|---|---|
| 定位 | "Agent优先"底座模型 |
| 输出速度 | 289 tokens/s ,是竞品(GPT-5.5、Claude Opus 4.7)的4倍 |
| 输出价格 | Claude Sonnet的1/25 |
| 应用 | 谷歌搜索AI Mode全球默认模型 |
Gemini 3.5 技术栈:
| 分层 | 组件 |
|---|---|
| 编排层(Agent) | Gemini Flash → Claude → GPT 弹性调度 |
| 模型层 | Gemini 3.5 Flash / Qwen-Image 2.0 / GPT-5.4 / Claude / DeepSeek V4 |
| 基础设施层 | GPU云服务 / 开源模型本地部署 |
开发者生态:
| 项目 | 数据 |
|---|---|
| 计算量(2025年) | 9.7万亿 |
| 计算量(2026年) | 480万亿 |
| 长期目标 | 3.2千兆 |
| Alphabet股价涨幅(2026年) | +25%(皮查伊亲自提及) |
来源:企鹅号、搜狐(2026年5月22-25日)
2. OpenAI GPT-5.6 曝光 --- 上下文窗口达 150万 tokens(5月26日)
曝光信息:
| 项目 | 内容 |
|---|---|
| 代号 | iris-alpha(预计为GPT-5.6) |
| 发现渠道 | 多名开发者在OpenAI Codex后端日志中发现 |
| 上下文窗口 | 150万tokens ,较GPT-5.5的105万tokens提升约43% |
| 同年代号 | ember-alpha、beacon-alpha |
| 预计发布 | 2026年6月 |
来源:企鹅号(2026年5月26日)
3. GPT-5.5 全量推送 --- 幻觉率降低 52.5%(5月持续)
核心升级:
| 指标 | 数据 |
|---|---|
| 默认模型 | 成为ChatGPT默认模型(替代GPT-5.3 Instant) |
| 高风险场景幻觉率 | 下降52.5% |
| 推理速度 | 提升3倍 |
| 通用上下文 | 突破100万Token |
| 代码能力 | 历史最强 |
新功能:
| 功能 | 说明 |
|---|---|
| "内存源"(Memory Sources) | Plus/Pro用户可调取历史对话及关联Gmail内容 |
| GPT-Realtime-2 | 实时语音模型,支持12.8万字上下文,毫秒级响应 |
来源:CSDN博客、企鹅号(2026年5月12-23日)
4. 国产大模型密集发布(4月底至5月)
发布清单:
| 模型 | 公司 | 核心亮点 |
|---|---|---|
| GPT-5.5 | OpenAI | Terminal-Bench 2.0达82.7%,Instant版免费开放 |
| DeepSeek V4 | DeepSeek | Flash和Pro双版本,1M+ token上下文 |
| Claude Sonnet 4.6 | Anthropic | 接近Opus级别性能 |
| Gemini Pro/Flash更新 | 1M token上下文 | |
| IBM Granite 4.1 | IBM | 8B参数实现32B MoE模型性能 |
| Qwen3.6系列 | 阿里巴巴 | --- |
| GLM-5.1 | 智谱AI | --- |
| Kimi K2.6 | 月之暗面 | 综合基准测试94.3分登顶 |
| 文心5.1 | 百度 | --- |
竞争格局:
| 梯队 | 模型 |
|---|---|
| 国际第一梯队 | Claude 4.7、GPT-5.5、Gemini 3.1 Pro(百万上下文已成标配) |
| 国内顶尖 | GLM-5.1、Kimi 2.6、DeepSeek V4(全面逼近甚至超越国际一线) |
| 核心竞争方向 | 超长上下文理解、端到端Agent自动化、复杂工程重构 |
来源:CSDN博客、企鹅号(2026年5月21-26日)
二、💰 国产AI千亿融资狂潮
1. DeepSeek --- 史上最大单笔融资 700亿元(5月)
融资详情:
| 项目 | 数据 |
|---|---|
| 融资金额 | 约700亿元人民币(约100亿美元) |
| 投前估值 | 约3500亿元(约450-515亿美元) |
| 创始人个人出资 | 200亿元 |
| 融资性质 | 首轮外部股权融资(此前坚持"不融资、不商业化") |
| 承诺 | 融资只为AGI,不为上市 |
估值跃升路径:
| 时间节点 | 估值 |
|---|---|
| 2026年4月初 | 约100亿美元 |
| 2026年5月初 | 约200亿美元 |
| 2026年5月中旬 | 约450亿美元 |
| 涨幅 | 翻了近5倍 |
投资方:
| 投资方 | 说明 |
|---|---|
| 国家集成电路产业投资基金(大基金) | 洽谈领投 |
| 腾讯控股 | 接近确定参与 |
| IDG资本 | 接近确定参与 |
| Monolith Capital | 接近确定参与 |
创始团队:
- 创始人梁文锋:明确承诺继续开发开源AI模型,追求AGI目标
来源:搜狐、企鹅号、新浪财经(2026年5月21-26日)
2. 月之暗面(Kimi)--- D轮20亿美元(5月7日)
融资详情:
| 项目 | 数据 |
|---|---|
| 融资金额 | 20亿美元(约136亿人民币) |
| 投后估值 | 200亿美元 |
| 融资轮次 | D轮 |
| 核实来源 | 财新、证券时报双重核实 |
估值跃升路径:
| 时间节点 | 估值 |
|---|---|
| 2025年底(C轮) | 43亿美元 |
| 2026年5月(D轮) | 200亿美元 |
| 涨幅 | 不到半年翻了近5倍 |
投资方:
| 类型 | 投资方 |
|---|---|
| 国资 | 国智投、北京AI基金、中国移动 |
| 产业资本 | 阿里、腾讯 |
公司动态:
| 项目 | 说明 |
|---|---|
| 核心负责人 | 因高强度工作与成本压力住院 |
| 组织调整 | 从B端回调C端 |
| 累计融资(半年) | 超39亿美元 |
来源:搜狐(2026年5月22日)
3. 阶跃星辰 --- 近25亿美元融资,加速冲刺IPO(5月)
融资详情:
| 项目 | 数据 |
|---|---|
| 融资金额 | 近25亿美元(约170亿+人民币) |
| 最新动态 | 加速冲刺IPO |
5月单月国产大模型融资:
| 公司 | 融资金额 |
|---|---|
| 月之暗面 | ~136亿元 |
| 阶跃星辰 | ~170亿元 |
| 合计(仅两家) | 超300亿元 |
来源:新浪网(2026年5月26日)
4. 2026年Q1中国AI融资数据
| 指标 | 数据 |
|---|---|
| 2026年Q1中国AI融资总额 | 超1100亿元 |
| 重点赛道 | 大模型 + 具身智能 |
| 国家大基金 | 首次入场大模型赛道 |
| 估值体系 | 一周内被彻底改写 |
| 评价 | 三天融资超70亿美元,中国大模型进入"决赛圈" |
来源:CSDN博客、搜狐(2026年5月22-26日)
三、🤖 AI Agent 与监管政策
1. 《智能体规范应用与创新发展实施意见》发布(5月8日)
政策信息:
| 项目 | 内容 |
|---|---|
| 发布部门 | 国家网信办、国家发改委、工信部(三部门联合) |
| 发布时间 | 2026年5月8日 |
| 政策地位 | 中国首部专门针对智能体领域的系统性顶层设计文件 |
| 核心原则 | 安全可控、规范有序、创新驱动、应用牵引 |
四大维度:
| 维度 | 内容 |
|---|---|
| 夯实技术基础 | 推动智能体核心技术研发 |
| 守牢安全底线 | 明确决策边界,用户享有知情权和最终决策权 |
| 强化应用牵引 | 覆盖科学研究、产业发展、提振消费、民生福祉、社会治理五大方向 |
| 构建创新生态 | 19个典型应用场景 |
决策边界划分:
| 决策类型 | 说明 |
|---|---|
| 用户本人决策 | 仅限用户自主操作 |
| 用户授权决策 | 需用户明确授权 |
| 智能体自主决策 | 需保障用户知情权和最终决策权 |
备案制度:
-
智能体备案成为核心合规要求
-
构建全流程治理体系
-
为企业智能体研发、部署与运营提出明确合规准则
来源:企鹅号、搜狐、中国经济新闻网(2026年5月19-27日)
2. Anthropic Claude for Office 全面上线(5月7日)
发布内容:
| 产品 | 状态 |
|---|---|
| Claude for Excel | 正式版全面上线 |
| Claude for PowerPoint | 正式版全面上线 |
| Claude for Word | 正式版全面上线 |
| Claude for Outlook | 公测开启 |
竞争意义:
-
直接与Microsoft 365 Copilot正面交锋
-
标志着AI办公软件进入"诺曼底登陆"阶段
-
不是"每个应用里塞一个AI聊天窗口"的浅集成
来源:CSDN博客(2026年5月22日)
3. Anthropic Claude for Financial Services 发布(5月5日)
产品信息:
| 项目 | 数据 |
|---|---|
| 发布日期 | 2026年5月5日 |
| 发布地点 | 纽约 |
| 性质 | 首个面向金融垂直行业的开源智能体工具集 |
核心组件:
| 组件 | 数量 |
|---|---|
| 专业AI Agent | 10个 |
| 领域技能 | 41项 |
| 金融数据连接器 | 11个 |
覆盖场景:
-
投资银行
-
股权研究
-
私募股权
-
财富管理
-
基金管理
-
运营合规
来源:CSDN博客(2026年5月22日)
四、💵 AI价格战:DeepSeek领降
1. DeepSeek-V4-Pro API 永久降价 75%(5月22日官宣)
降价详情:
| 指标 | 降价前 | 降价后 | 降幅 |
|---|---|---|---|
| 百万Tokens输入(缓存命中) | 0.1元 | 0.025元 | 75% |
| 百万Tokens输入(缓存未命中) | 12元 | 3元 | 75% |
| 百万Tokens输出 | 24元 | 6元 | 75% |
| 百万Tokens输入(美元) | $0.0145 | $0.003625 | 75% |
| 百万Tokens输出(美元) | $3.48 | $0.87 | 75% |
执行时间: 2026年5月31日15:59 UTC起正式生效(原优惠活动结束即锁定新价,不回调)
价格对比(每百万Tokens):
| 模型 | 输入价格 | 输出价格 |
|---|---|---|
| DeepSeek-V4-Pro(新价) | 0.025元 | 6元 |
| 通义千问Qwen3.6-Plus | 0.8元 | 1.6元 |
| Kimi K2.6 | 6.84元 | 28.8元 |
| 智谱GLM-5 | 12元 | --- |
| 文心一言旗舰版 | 10元 | 20元 |
| GPT-4o(国际) | 18元 | 72元 |
| Claude Sonnet 4.6(国际) | 21.6元 | 108元 |
意义:
-
直接击穿行业价格底线
-
标志着国产大模型从"技术追赶"转向生态与定价权争夺
-
中小企业AI开发门槛彻底打破
来源:搜狐、IT168、企鹅号、同花顺(2026年5月22-27日)
2. 小米 MiMo 大模型 API 永久降价 最高99%(5月27日)
降价详情:
| 项目 | 内容 |
|---|---|
| 公司 | 小米 |
| 模型 | MiMo V2.5系列 |
| 最高降幅 | 99% |
| 特点 | 不再区分上下文窗口长度 |
| Token Plan优化 | 同等价格下用量提升至原来的5-8倍 |
| 生效时间 | 北京时5月27日0:00 |
来源:企鹅号(2026年5月27日)
3. 行业背景:成本上涨与价格战的矛盾
逆市降价背景:
| 指标 | 变化 |
|---|---|
| HBM内存价格(2026年) | 暴涨500% |
| 主流云厂商API涨幅 | 最高达463% |
| 行业普遍 | "涨价保成本" |
| DeepSeek策略 | 架构创新+国产算力深度适配,推理算力降至上代27% |
来源:CSDN博客(2026年5月25日)
五、🌐 国际AI动态
1. Andrej Karpathy 加入 Anthropic(5月19日)
人事变动详情:
| 项目 | 内容 |
|---|---|
| 人物 | Andrej Karpathy |
| 身份 | OpenAI创始成员、特斯拉Autopilot前主管 |
| 新职位 | 加入Anthropic |
| 日期 | 2026年5月19日 |
| 行业意义 | AI行业顶尖人才流动的标志性节点 |
来源:CSDN博客(2026年5月25日)
2. Anthropic 有望2026年Q2率先盈利(5月21日)
财务数据:
| 指标 | Q1 2026 | Q2 2026(预期) |
|---|---|---|
| 营收 | 48亿美元 | 109亿美元(翻倍增长) |
| 营业利润 | --- | 5.59亿美元 |
| 意义 | --- | 全球主流AI企业中较早实现盈利 |
估值动态:
-
即将完成新一轮大规模融资
-
估值有望突破9000亿美元
-
若完成,将超越OpenAI成为全球估值最高的AI初创企业
-
IPO预期:最快2026年10月
来源:企鹅号(2026年5月21-25日)
3. OpenAI 重大战略调整(5月)
广告平台:
- 上线广告平台,6周实现超1亿美元年化收入
独家授权解除:
-
解除微软独家授权
-
向AWS、谷歌云等所有云厂商开放GPT模型
招聘动态:
-
最高开出44.5万美元年薪招聘安全研究员
-
要求:有品位、有策略性
来源:CSDN博客(2026年5月23日)
4. 微软 Fara1.5 浏览器AI Agent 发布(5月25日)
产品信息:
| 项目 | 数据 |
|---|---|
| 产品名称 | Fara1.5系列浏览器AI智能体 |
| 发布日期 | 2026年5月25日 |
| 端到端任务完成率 | 72% |
| 对比 | 优于OpenAI Operator模型 |
技术能力:
-
精准解析网页结构
-
准确填写表单
-
自主完成页面跳转与交互
-
多数日常网页场景稳定执行全流程任务
来源:同花顺财经(2026年5月25日)
5. AMD AI开发者大会首次在中国举行(5月19日)
大会信息:
| 项目 | 内容 |
|---|---|
| 大会名称 | AMD AI DevDay 2026 |
| 时间 | 2026年5月19日 |
| 地点 | 上海 |
| 参会开发者 | 超过2000名 |
| 地位 | AMD AI开发者大会首次登陆中国 |
AMD与Meta合作:
-
AMD与Meta达成6吉瓦GPU供应协议
-
Meta首批AI系统基于AMD Instinct MI450架构定制
-
代号"Venice"的第六代AMD EPYC CPU
-
预计2026年下半年开始发货
来源:企鹅号(2026年5月23日)
6. AI Token"贩子"热潮(5月)
行业现象:
-
多个AI模型聚合平台涌现
-
号称"一个API Key = Claude + GPT + Gemini + 国产大模型全系列"
-
孙宇晨、猎豹移动CEO傅盛(Easy Router,宣称一个Key调用40余个主流大模型)等名人入局
来源:新浪网(2026年5月24日)
六、💻 AI编程与工具
1. Claude Code 全自动模式正式开放
功能升级: Claude Code Auto Mode 结束测试,正式全面开放。
AI可独立完成:
-
需求分析
-
编码
-
重构
-
测试
-
部署
高危操作需人工确认,普通开发全程自动化。
来源:CSDN博客(2026年5月25日)
2. 微软内部Claude Code禁令(5月26日)
事件:
-
微软宣布将于6月30日前取消内部大多数工程师的Claude Code许可
-
背景:仅6个月前,微软还在大规模推广Claude Code
-
原因:AI工具按Token计费的账单已经高到连市值3.5万亿美元的巨头都承受不起
-
同类事件:Uber 2026年全年AI预算在前4个月彻底烧光
来源:新浪网(2026年5月26日)
3. 架构突破:1200万Token超长上下文
技术参数:
| 项目 | 数据 |
|---|---|
| 架构名称 | SubCube(稀疏注意力架构) |
| 最高上下文 | 1200万Token |
| 推理成本 | 仅为Claude的5% |
应用场景:
-
一次性加载完整代码库
-
超大知识库
-
百万字文档
来源:CSDN博客(2026年5月25日)
七、🔧 算力与芯片
1. 苏姿丰台北演讲:AI推理芯片将占据主流(5月22日)
核心观点:
-
当前AI训练市场本质是"烧钱却难以盈利的商业模式"
-
未来几年AI推理芯片将占据主流
-
英伟达的芯片面临挑战
AMD市场预测:
| 项目 | 数据 |
|---|---|
| 服务器CPU TAM年复合增长率 | 超过35% |
| 2030年目标TAM | 超过1200亿美元 |
来源:搜狐(2026年5月25日)
2. 台积电3纳米代工涨价(5月27日)
涨价信息:
| 时间 | 涨幅 |
|---|---|
| 2026年下半年 | 最高15% |
| 2027年 | 预计5%至10% |
背景:
-
英伟达Vera Rubin平台加快量产节奏
-
多家科技企业定制化AI专用芯片项目进入大规模投片阶段
-
3纳米工艺在AI服务器领域订单需求持续攀升
来源:中关村在线(2026年5月27日)
3. 英伟达610.47驱动暗藏DLSS 5(5月27日)
驱动信息:
| 项目 | 内容 |
|---|---|
| 驱动版本 | 610.47 |
| 发布时间 | 2026年5月27日 |
| 新增参数 | DLSS-NR、DLSS-NR Streamline、DLSS-NR Presets |
| 技术定位 | Neural Rendering(神经渲染) |
| 正式启用 | 预计2026年秋季 |
来源:同花顺财经(2026年5月27日)
4. 英伟达 Rubin 平台规格
| 项目 | 数据 |
|---|---|
| 晶体管数量 | 3360亿个(Blackwell为2080亿) |
| HBM4显存 | 288GB |
| 显存带宽 | 22TB/s |
| NVFP4精度算力 | 50 PFLOPS |
| SM单元 | 224个 |
| 第六代Tensor Core | ✅ |
| 第三代Transformer Engine | ✅ |
来源:CSDN博客(2026年5月26日)
八、📅 本周重要时间线
| 日期 | 事件 |
|---|---|
| 5月7日 | 月之暗面完成20亿美元D轮融资;Claude for Office全面上线 |
| 5月8日 | 《智能体规范应用与创新发展实施意见》发布 |
| 5月19日 | AMD AI DevDay首次在上海举办(2000+开发者);Andrej Karpathy加入Anthropic |
| 5月20日 | 谷歌I/O 2026召开,Gemini 3.5 Flash发布 |
| 5月21日 | Anthropic Q2 2026有望率先盈利(营收预期109亿美元) |
| 5月22日 | DeepSeek官宣V4-Pro API永久降价75%;英伟达苏姿丰台北演讲 |
| 5月23日 | DeepSeek-V4-Pro API降价消息扩散;阶跃星辰近25亿美元融资 |
| 5月25日 | 微软发布Fara1.5浏览器Agent;Claude Code被微软内部禁用 |
| 5月26日 | GPT-5.6曝光(150万上下文);DeepSeek估值3500亿元 |
| 5月27日 | 小米MiMo V2.5 API降价99%;台积电涨价15% |
| 5月28日 | AMD CEO预测服务器CPU TAM将达1200亿美元 |
九、🔍 趋势洞察
-
大模型军备竞赛白热化:GPT-5.5全量推送、Gemini 3.5 Flash发布、GPT-5.6曝光,大模型正式进入"百万Token时代",上下文窗口成为核心竞争指标。
-
国产AI千亿融资狂潮:DeepSeek 700亿元、月之暗面136亿元、阶跃星辰170亿元,国家大基金首次入场,国产AI估值体系一周内被彻底改写。
-
AI价格战全面开打:DeepSeek-V4-Pro API永久降价75%(输入低至0.025元/百万Token),小米降幅99%,直接击穿行业价格底线,中小企业AI开发门槛彻底打破。
-
AI Agent监管中国方案落地:《智能体规范应用与创新发展实施意见》发布,19个典型应用场景,确立"AI做事、人负责"原则,备案制度成为核心合规要求。
-
Anthropic商业化领跑:Q2营收预计109亿美元翻倍增长,有望成为全球首个盈利AI企业,估值冲击9000亿美元超越OpenAI。
-
AI办公软件进入正面战:Claude全面入侵Office(Excel、PowerPoint、Word、Outlook),直接与Microsoft 365 Copilot竞争,标志着AI生产力工具进入诺曼底登陆阶段。
-
AI推理芯片崛起:苏姿丰预言推理芯片将取代训练芯片成为主流,AMD预测2030年服务器CPU TAM超1200亿美元。
-
顶尖人才加速流动:Andrej Karpathy加入Anthropic,标志着AI竞争从技术比拼进入人才与战略博弈新阶段。
十、⚠️ 风险与挑战
| 挑战 | 说明 |
|---|---|
| 价格战与成本矛盾 | HBM暴涨500%、主流云厂商涨价463%,DeepSeek逆市降价75%,盈利压力巨大 |
| Token计费黑洞 | 微软Claude Code账单高到被内部禁用,Uber全年AI预算4个月烧光 |
| 幻觉率依然严峻 | 尽管GPT-5.5降低52.5%,但高风险场景(医疗、法律、金融)错误成本依然极高 |
| 融资泡沫担忧 | 千亿融资扎堆,国产大模型估值体系被改写,市场能否消化存疑 |
| 监管合规压力 | 《实施意见》要求智能体备案,企业合规成本上升 |
| GPU供应链瓶颈 | 台积电3纳米代工涨价15%,AI芯片产能依然紧张 |
| AI人才争夺白热化 | OpenAI开出44.5万美元年薪招人,人才成本持续攀升 |
免责声明:本简报内容来自公开新闻报道、企业公告、行业研报及资讯,仅供参考,不构成投资建议。
附:本周关键数据汇总
| 类别 | 数据 |
|---|---|
| 最大融资 | DeepSeek 700亿元(月之暗面136亿元、阶跃星辰170亿元) |
| 最高估值 | DeepSeek 3500亿元(Anthropic 9000亿美元) |
| 最快推理速度 | Gemini 3.5 Flash 289 tokens/s(竞品4倍) |
| 最大价格降幅 | 小米MiMo API降价99%、DeepSeek降价75% |
| 最低API价格 | DeepSeek-V4-Pro 输入0.025元/百万Token |
| 最大会议 | AMD AI DevDay 2000+开发者参会 |
| 最大用户规模 | Gemini月活9亿 |
| 最大营收预期 | Anthropic Q2 109亿美元 |
| 最大成本 | Uber全年AI预算4个月烧光 |