苹果WWDC 2026前瞻：Ferret-Pro端侧大模型即将亮相｜小亦之闻｜AI 编程三日速递！（5月26日～5月28日）

介绍：

#AI及人工智能方面🖥️（5月26日～5月28日）

26日：

1、 OpenAI提交更新版招股书，估值目标上探至1.1万亿美元

OpenAI正式向美国SEC提交更新版S-1招股书，计划于9月中旬挂牌，目标估值区间上调至1万亿至1.1万亿美元。文件显示其年化营收已突破320亿美元，付费企业客户超过120万。所募资金将重点投向GPT-6训练（预计耗资50亿美元）、自研AI芯片"Atlas"量产及三个新海外实验室建设。同时披露GPT-5.5已完成对2000万行遗留代码的安全审计，零重大漏洞发现。

2、英伟达发布Blackwell Ultra架构，推理性能大幅提升

在年度投资者日上，英伟达正式发布新一代GPU架构Blackwell Ultra，面向万亿参数大模型推理优化。其单卡HBM4内存容量增至288GB，支持FP4/FP6精度下的800 TFLOPS算力，推理能效比较H200提升4倍。首发合作伙伴包括微软Azure、谷歌云和Oracle，将于7月出货。分析师指出，这将显著降低大模型推理成本，加速Agent与多模态应用落地。

3、字节跳动开源Lance 3B升级版，支持实时视频理解

字节跳动在Lance 3B基础上发布Lance 3B-VL-256K，新增256K超长视频理解与实时流处理能力，可在普通游戏显卡上处理10分钟以上的连续视频输入。模型权重、训练数据配比及微调工具同步开源，采用Apache 2.0协议。

4、南方科技大学发布开源时序大模型Timer-X

南方科技大学团队开源时序预测大模型Timer-X，基于10亿参数，在电力负荷、交通流量、金融交易等300多个时序基准上超越传统统计模型与专用深度学习模型。模型支持零样本预测，无需针对特定数据集进行训练，降低时序AI应用门槛。

27日：

5、 DeepSeek降价效应持续，中小企业AI应用成本大幅下降

自永久降价政策生效以来，DeepSeek API日均调用量连续三日攀升，较降价前增长超80%。多家中小企业反馈，原先受成本限制搁置的智能客服、文档分析、代码辅助等项目已重新启动。同时，DeepSeek宣布针对初创企业推出"星火计划"，提供首年额外30%的额度补贴。

6、索尼发布AI驱动游戏角色引擎"Morpheus"

索尼互动娱乐发布新一代游戏AI引擎Morpheus，使非玩家角色能够根据玩家行为动态调整对话、情感与策略。该引擎基于轻量化本地模型运行，无需联网，即将应用于PlayStation 6的首发游戏中。

7、OpenAI IPO路演启动，投资者认购需求远超预期

OpenAI于5月27日正式启动全球路演，首日纽约、伦敦两场机构投资者会议均出现超额认购迹象。据知情人士透露，基石投资者意向认购金额已超500亿美元，远超原计划募资额度。公司高管在路演中着重展示了GPT-5.5在企业级市场的渗透速度，以及即将发布的GPT-6训练进展。

8、世界模型新突破：Genie 3展现类人直觉物理理解

DeepMind发布的Genie 3在学术界引发强烈反响。研究论文显示，该模型在未见过的场景中能够准确预测物体轨迹与物理交互，涌现出对重力、碰撞、遮挡等概念的隐式理解能力。团队将其定义为"生成式世界模型"的重要里程碑，并开源了部分训练方法与评估基准。

28日：

9、OpenAI路演进入亚洲站，披露GPT-5.5推理成本再降40%

OpenAI全球路演第二日来到新加坡和东京。管理层在交流中透露，通过模型量化与稀疏激活技术的深度优化，GPT-5.5的推理成本已较发布初期累计降低40%，并将在三季度通过API价格下调传递至开发者。基石认购规模已突破700亿美元，有望创下科技公司IPO纪录。

10、谷歌发布轻量级大模型Gemini Nano 3，可离线运行复杂任务

谷歌推出新一代端侧模型Gemini Nano 3，参数规模仅2.7B，但在MMLU、数学推理等基准上接近上一代70亿参数模型水平。该模型专为手机和IoT设备设计，支持离线运行复杂任务，如多步推理、长文总结和多轮对话。三星已确认下一代Galaxy手机将预装该模型。

11、英伟达与台积电推进2nm AI芯片，预计2027年量产

据供应链消息，英伟达正与台积电紧密合作，基于2nm工艺开发下一代AI加速芯片，代号"Rubin Next"。该芯片将为万亿参数大模型训练与推理设计，能效比较Blackwell Ultra预计再提升3倍，计划2027年下半年进入量产。

12、Meta开源多模态模型Llama 4-Vision，性能对标GPT-5.5视觉版

Meta突然开源了多模态视觉语言模型Llama 4-Vision，参数规模70B，支持图像、视频流输入和推理。在多项视觉问答基准上，该模型性能达到GPT-5.5 Instant Vision的94%，且完全可商用，引起开源社区热烈反响。

13、谷歌发布可解释性工具Concept Bottleneck 2.0，解构大模型思维

谷歌AI推出的Concept Bottleneck 2.0工具已在Hugging Face开放使用。该工具可将任意文本生成过程解析为人类可理解的概念流（如"情感"、"对比"、"因果"），并以交互式图表展示各概念对输出的影响权重，帮助非AI专家理解模型决策依据。

##编程💻（5月26日～5月28日）

26日

1、Claude Code发布重大更新：支持自定义Agent团队

Anthropic为Claude Code推送v3.5版本，开发者可以定义多个具有不同系统提示词和工具权限的Agent，并编排其协作。例如，"架构师Agent"设计模块、"编码Agent"实现、"审查Agent"检查，三者循环迭代直到达到质量标准。

2、DeepSeek CodeHarness首个演示：全自动化修复大型代码库

DeepSeek发布CodeHarness技术演示视频，展示Agent自主修复一个4万行开源Python项目的62个已知Bug，其中包括3个多年未解决的并发问题，整个过程耗时不到半小时。其核心技术为"规划-搜索-编辑-验证"循环，使用V3模型进行规划，R1模型进行精确定位修复。内测申请入口已开放。

27日：

3、TypeScript 6.0预览版发布，引入AI驱动类型推导

TypeScript团队发布了6.0预览版，最引人注目的新特性是AI辅助类型推导。当编译器无法推断类型时，会自动调用本地小型语言模型，根据上下文上下文生成候选类型签名，供开发者选择确认。该功能为可选启用，模型完全本地运行。

4、Java 26生态快速繁荣，虚拟线程框架趋于成熟

随着Java 26中虚拟线程的广泛普及，一批与之配套的轻量级并发框架涌现。例如"LoomWeb"框架允许用极少量线程处理百万级并发连接，性能追平或超越部分异步框架。Spring Boot 4.0正式版已全面适配虚拟线程，默认配置下即可获得显著吞吐量提升。

28日：

5、Python 4.0 Alpha 1发布，引入模式匹配增强与JIT改进

Python核心团队发布了Python 4.0首个Alpha版本。主要特性包括：模式匹配引入嵌套守卫和类属性解构，初步集成的自适应JIT编译器在计算密集型代码中提速30%，以及新增的不可变字典类型frozenmap。正式版预计2027年发布。

6、Deno 4.0发布，实现Web标准与系统编程深度融合

Deno 4.0正式发布，引入原生Rust插件系统和WASI全面支持，允许开发者在TypeScript中直接调用高性能Rust库。同时强化了npm兼容性，实现了在单一运行时中融合快速开发与底层性能调优的目标。

--- 感谢观看---

制作：Code.小亦

查找来源：微博、新浪财经、今日头条、搜狐、deepseek-ai、新华社、网易新闻。

初审：Code.小亦。

终审：Code.小亦。

本文章属于原创作品，禁止任何人进行转载，除合作之外！！

苹果WWDC 2026前瞻：Ferret-Pro端侧大模型即将亮相｜小亦之闻｜AI 编程三日速递！（5月26日～5月28日）

介绍：

#AI及人工智能方面🖥️（5月26日～5月28日）

26日：

1、 OpenAI提交更新版招股书，估值目标上探至1.1万亿美元

2、英伟达发布Blackwell Ultra架构，推理性能大幅提升

3、字节跳动开源Lance 3B升级版，支持实时视频理解

4、 南方科技大学发布开源时序大模型Timer-X

27日：

5、 DeepSeek降价效应持续，中小企业AI应用成本大幅下降

6、索尼发布AI驱动游戏角色引擎"Morpheus"

7、OpenAI IPO路演启动，投资者认购需求远超预期

8、世界模型新突破：Genie 3展现类人直觉物理理解

28日：

9、OpenAI路演进入亚洲站，披露GPT-5.5推理成本再降40%

10、谷歌发布轻量级大模型Gemini Nano 3，可离线运行复杂任务

11、英伟达与台积电推进2nm AI芯片，预计2027年量产

12、Meta开源多模态模型Llama 4-Vision，性能对标GPT-5.5视觉版

13、谷歌发布可解释性工具Concept Bottleneck 2.0，解构大模型思维

##编程💻（5月26日～5月28日）

26日

1、Claude Code发布重大更新：支持自定义Agent团队

2、DeepSeek CodeHarness首个演示：全自动化修复大型代码库

27日：

3、TypeScript 6.0预览版发布，引入AI驱动类型推导

4、Java 26生态快速繁荣，虚拟线程框架趋于成熟

28日：

5、Python 4.0 Alpha 1发布，引入模式匹配增强与JIT改进

6、Deno 4.0发布，实现Web标准与系统编程深度融合

--- 感谢观看---

制作：Code.小亦

查找来源：微博、新浪财经、今日头条、搜狐、deepseek-ai、新华社、网易新闻。

如在阅读中发现知识性错误、代码错误、错别字错误等情况私信博主或评论或通过邮箱2952104443@qq.com。

4、南方科技大学发布开源时序大模型Timer-X