苹果WWDC 2026前瞻:Ferret-Pro端侧大模型即将亮相|小亦之闻|AI 编程三日速递!(5月26日~5月28日)

介绍:

#AI及人工智能方面🖥️(5月26日~5月28日)

26日:

1、 OpenAI提交更新版招股书,估值目标上探至1.1万亿美元

OpenAI正式向美国SEC提交更新版S-1招股书,计划于9月中旬挂牌,目标估值区间上调至1万亿至1.1万亿美元。文件显示其年化营收已突破320亿美元,付费企业客户超过120万。所募资金将重点投向GPT-6训练(预计耗资50亿美元)、自研AI芯片"Atlas"量产及三个新海外实验室建设。同时披露GPT-5.5已完成对2000万行遗留代码的安全审计,零重大漏洞发现。

2、英伟达发布Blackwell Ultra架构,推理性能大幅提升

在年度投资者日上,英伟达正式发布新一代GPU架构Blackwell Ultra,面向万亿参数大模型推理优化。其单卡HBM4内存容量增至288GB,支持FP4/FP6精度下的800 TFLOPS算力,推理能效比较H200提升4倍。首发合作伙伴包括微软Azure、谷歌云和Oracle,将于7月出货。分析师指出,这将显著降低大模型推理成本,加速Agent与多模态应用落地。

3、字节跳动开源Lance 3B升级版,支持实时视频理解

字节跳动在Lance 3B基础上发布Lance 3B-VL-256K,新增256K超长视频理解与实时流处理能力,可在普通游戏显卡上处理10分钟以上的连续视频输入。模型权重、训练数据配比及微调工具同步开源,采用Apache 2.0协议。

4、 南方科技大学发布开源时序大模型Timer-X

南方科技大学团队开源时序预测大模型Timer-X,基于10亿参数,在电力负荷、交通流量、金融交易等300多个时序基准上超越传统统计模型与专用深度学习模型。模型支持零样本预测,无需针对特定数据集进行训练,降低时序AI应用门槛。

27日:

5、 DeepSeek降价效应持续,中小企业AI应用成本大幅下降

自永久降价政策生效以来,DeepSeek API日均调用量连续三日攀升,较降价前增长超80%。多家中小企业反馈,原先受成本限制搁置的智能客服、文档分析、代码辅助等项目已重新启动。同时,DeepSeek宣布针对初创企业推出"星火计划",提供首年额外30%的额度补贴。

6、索尼发布AI驱动游戏角色引擎"Morpheus"

索尼互动娱乐发布新一代游戏AI引擎Morpheus,使非玩家角色能够根据玩家行为动态调整对话、情感与策略。该引擎基于轻量化本地模型运行,无需联网,即将应用于PlayStation 6的首发游戏中。

7、OpenAI IPO路演启动,投资者认购需求远超预期

OpenAI于5月27日正式启动全球路演,首日纽约、伦敦两场机构投资者会议均出现超额认购迹象。据知情人士透露,基石投资者意向认购金额已超500亿美元,远超原计划募资额度。公司高管在路演中着重展示了GPT-5.5在企业级市场的渗透速度,以及即将发布的GPT-6训练进展。

8、世界模型新突破:Genie 3展现类人直觉物理理解

DeepMind发布的Genie 3在学术界引发强烈反响。研究论文显示,该模型在未见过的场景中能够准确预测物体轨迹与物理交互,涌现出对重力、碰撞、遮挡等概念的隐式理解能力。团队将其定义为"生成式世界模型"的重要里程碑,并开源了部分训练方法与评估基准。

28日:

9、OpenAI路演进入亚洲站,披露GPT-5.5推理成本再降40%

OpenAI全球路演第二日来到新加坡和东京。管理层在交流中透露,通过模型量化与稀疏激活技术的深度优化,GPT-5.5的推理成本已较发布初期累计降低40%,并将在三季度通过API价格下调传递至开发者。基石认购规模已突破700亿美元,有望创下科技公司IPO纪录。

10、谷歌发布轻量级大模型Gemini Nano 3,可离线运行复杂任务

谷歌推出新一代端侧模型Gemini Nano 3,参数规模仅2.7B,但在MMLU、数学推理等基准上接近上一代70亿参数模型水平。该模型专为手机和IoT设备设计,支持离线运行复杂任务,如多步推理、长文总结和多轮对话。三星已确认下一代Galaxy手机将预装该模型。

11、英伟达与台积电推进2nm AI芯片,预计2027年量产

据供应链消息,英伟达正与台积电紧密合作,基于2nm工艺开发下一代AI加速芯片,代号"Rubin Next"。该芯片将为万亿参数大模型训练与推理设计,能效比较Blackwell Ultra预计再提升3倍,计划2027年下半年进入量产。

12、Meta开源多模态模型Llama 4-Vision,性能对标GPT-5.5视觉版

Meta突然开源了多模态视觉语言模型Llama 4-Vision,参数规模70B,支持图像、视频流输入和推理。在多项视觉问答基准上,该模型性能达到GPT-5.5 Instant Vision的94%,且完全可商用,引起开源社区热烈反响。

13、谷歌发布可解释性工具Concept Bottleneck 2.0,解构大模型思维

谷歌AI推出的Concept Bottleneck 2.0工具已在Hugging Face开放使用。该工具可将任意文本生成过程解析为人类可理解的概念流(如"情感"、"对比"、"因果"),并以交互式图表展示各概念对输出的影响权重,帮助非AI专家理解模型决策依据。

##编程💻(5月26日~5月28日)

26日

1、Claude Code发布重大更新:支持自定义Agent团队

Anthropic为Claude Code推送v3.5版本,开发者可以定义多个具有不同系统提示词和工具权限的Agent,并编排其协作。例如,"架构师Agent"设计模块、"编码Agent"实现、"审查Agent"检查,三者循环迭代直到达到质量标准。

2、DeepSeek CodeHarness首个演示:全自动化修复大型代码库

DeepSeek发布CodeHarness技术演示视频,展示Agent自主修复一个4万行开源Python项目的62个已知Bug,其中包括3个多年未解决的并发问题,整个过程耗时不到半小时。其核心技术为"规划-搜索-编辑-验证"循环,使用V3模型进行规划,R1模型进行精确定位修复。内测申请入口已开放。

27日:

3、TypeScript 6.0预览版发布,引入AI驱动类型推导

TypeScript团队发布了6.0预览版,最引人注目的新特性是AI辅助类型推导。当编译器无法推断类型时,会自动调用本地小型语言模型,根据上下文上下文生成候选类型签名,供开发者选择确认。该功能为可选启用,模型完全本地运行。

4、Java 26生态快速繁荣,虚拟线程框架趋于成熟

随着Java 26中虚拟线程的广泛普及,一批与之配套的轻量级并发框架涌现。例如"LoomWeb"框架允许用极少量线程处理百万级并发连接,性能追平或超越部分异步框架。Spring Boot 4.0正式版已全面适配虚拟线程,默认配置下即可获得显著吞吐量提升。

28日:

5、Python 4.0 Alpha 1发布,引入模式匹配增强与JIT改进

Python核心团队发布了Python 4.0首个Alpha版本。主要特性包括:模式匹配引入嵌套守卫和类属性解构,初步集成的自适应JIT编译器在计算密集型代码中提速30%,以及新增的不可变字典类型frozenmap。正式版预计2027年发布。

6、Deno 4.0发布,实现Web标准与系统编程深度融合

Deno 4.0正式发布,引入原生Rust插件系统和WASI全面支持,允许开发者在TypeScript中直接调用高性能Rust库。同时强化了npm兼容性,实现了在单一运行时中融合快速开发与底层性能调优的目标。

--- 感谢观看---

制作:Code.小亦
查找来源:微博、新浪财经、今日头条、搜狐、deepseek-ai、新华社、网易新闻。

初审:Code.小亦。

终审:Code.小亦。

本文章属于原创作品,禁止任何人进行转载,除合作之外!!

如在阅读中发现知识性错误、代码错误、错别字错误等情况私信博主或评论或通过邮箱2952104443@qq.com。
相关推荐
搬砖的小码农_Sky4 小时前
macOS Sequoia OpenClaw + Ollama 本地离线部署(免API、Apple Silicon金属加速)
人工智能·macos·ai·人机交互
UTF_85 小时前
一次NSMutableAttributedString误用的思考
ios·面试·github
稚枭天卓8 小时前
mac 安装 redis
redis·macos
AugustRed9 小时前
MacOS 运维常用命令大全(超全速查表)
运维·macos
人月神话-Lee9 小时前
【图像处理】Core Image 与 GPU 渲染管线——让滤镜飞起来
图像处理·人工智能·ios·chatgpt·ai编程·swift·gpu
稚枭天卓13 小时前
mac 安装mysql
mysql·macos
夏天的峰没有风13 小时前
Typora+gitcode+picgo搭建免费图床
开发语言·ios·swift
库奇噜啦呼13 小时前
【iOS】源码学习-分类、扩展、关联对象
学习·ios·分类
帅次1 天前
Android 17 开发者实战:核心更新与应用场景落地指南
android·java·ios·android studio·iphone·android jetpack·webview