AI领域一周纵览:从大模型更新到开源生态的前沿动态

1.AI 大事件

Google I/O 2025 开发者大会,从研究到现实,AI 技术全面升级[1]

Google I/O 2025 大会宣布多项进展。

  • Gemini 2.5 Pro 模型在 LMArena 排行榜首位,性能卓越。

  • 推出 Google Beam 视频通信平台,提供沉浸式 3D 体验。

  • Gemini Live 整合 Project Astra 功能,Agent Mode 助力任务执行。

  • 个性化智能回复将推出,AI Mode 重塑搜索体验。

  • 全新 Imagen 4 生成细节超逼真。

  • Veo 3 首次实现音视频融合。凭借其逼真的场景、可控的角色一致性、声音合成及多样的编辑功能,在 AI 视频生成领域树立了新的标杆。

Anthropic 发布史上最强 AI 模型 Claude 4

Anthropic 发布 Claude 4 模型 (包括 Claude Opus 4 和 Claude Sonnet 4)。

该模型被誉为 "史上最强 AI 模型" 及"世界最佳编程模型",具备分析数千数据源长时间执行任务编写接近人类水平内容复杂操作的能力。

它采用了全新的混合推理架构,能在 SWE-Bench Verified 测试中取得 72.5% 成绩,Terminal-bench 测试中取得 43.2% 成绩,并具备长达 7 小时的持续工作能力。

OpenAI 最大收购,65 亿美元拿下苹果前高管 Jony Ive 公司 io[3]

OpenAI 宣布以约 65 亿美元收购由 CEO Sam Altman 与前苹果首席设计官 Jony Ive 联合创办的 AI 设备初创公司 io。

这笔收购将是 OpenAI 史上最大一笔交易,预计夏季完成,需监管部门批准。

收购后,OpenAI 将获得约 55 名顶尖硬件工程师、软件开发者和制造专家,包括多位曾参与 iPhone 设计的前苹果设计师。

微软 Build 2025 大会:拥抱 MCP 协议,引入 xAI 大模型[4]

微软在 Build 2025 大会上宣布全面支持模型上下文协议(MCP),并与 GitHub 共同加入 MCP 指导委员会,推动开放标准落地。其智能体方案已覆盖超过 23 万家机构。

同时,微软公司宣布把埃隆 · 马斯克的 xAI 公司的 Grok 3 和 Grok 3 mini 人工智能模型引入 Azure AI Foundry 平台,作为微软在公司云平台内直接托管和收费的新产品。

OpenAI 等科技巨头将在阿联酋建设人工智能基础设施集群[5]

OpenAI、英伟达等科技巨头将携手合作,在阿拉伯联合酋长国建设一座名为 "星际之门阿联酋"(Stargate UAE)的人工智能基础设施集群。

这一项目是 OpenAI、软银和甲骨文今年 1 月宣布在美国建设人工智能基础设施计划的姊妹项目,预计第一阶段的 200 兆瓦人工智能 "集群" 将于 2026 年投入使用。

2.新产品发布

豆包上线视频通话功能:支持实时视频问答互动[6]

豆包 App 实时通话功能升级,支持视频聊天问答。

本次升级基于视觉推理模型,支持联网搜索,工作、生活和学习遇到问题,随时和豆包视频对话。

该功能具有实时场景理解能力,通过摄像头捕捉用户周围环境,结合问题进行智能分析。从日常生活到专业工作,多场景适用。

混元游戏:首个工业级 AIGC 游戏内容生产引擎发布[7]

腾讯混元游戏视觉生成平台正式发布。是首个工业级 AIGC 游戏内容生产引擎,依托混元大模型打造,可大幅提升游戏资产生成与制作效率。

平台面向游戏美术设计师提供 AI 美术管线、实时画布、AI 2D 美术生成、专业角色多视图生成等核心功能,助力设计师快速生成高质量游戏素材与概念草案,将游戏美术设计效率提升数十倍。

美团推出零代码 AI 应用开发平台 NoCode[8]

美团推出零代码 AI 应用开发平台 NoCode,无需编程经验,通过自然语言描述即可快速生成网站页面、实用工具、小游戏等应用。

平台具备自然语言编程、实时预览、局部修改及一键部署分享等功能,支持版本管理,可实时渲染页面。

Flowith 推出 Agent Neo[9]

Flowith 推出 Agent Neo,具备无限步骤、无限上下文、无限工具的核心能力,可执行复杂任务、处理海量信息并调用多种大模型与工具。

结合知识库功能,能快速构建数字分身或生成高质量内容。

腾讯 QQ 浏览器推出 QBot AI 浏览器[10]

腾讯正式推出 AI 浏览器 QBot,融合了先进的人工智能技术,为用户提供更智能、便捷的上网体验。

具备智能搜索、内容推荐、语言翻译等多种功能,能根据用户的浏览习惯和偏好提供个性化的服务。

OpenAI 扩展 Responses API:支持 MCP、图像生成[11]

OpenAI 宣布扩展 Responses API,新增对远程连接 MCP 服务器、图像生成(gpt-image-1 模型)、Code Interpreter 及文件搜索优化等功能的支持,全面适配 GPT-4o 系列、GPT-4.1 系列及 OpenAI o 系列推理模型。

开发者可通过几行代码让模型连接 Cloudflare 等 MCP 工具,访问用户数据源。

昆仑万维发布天工超级智能体[12]

昆仑万维面向全球发布天工超级智能体(Skywork Super Agents),采用 AI agent 架构和 deep research 技术,能生成文档、PPT、表格、网页、播客和音视频等多模态内容。

其 deep research 能力在 GAIA 榜单上排名全球第一,超过 OpenAI Deep Research 和 Manus。

万兴科技 Filmora 升级 AI 功能[13]

万兴科技旗下视频创意软件 Wondershare Filmora 作为微软全球开发者大会主论坛合作伙伴亮相。

桌面端升级 AI Mate(视频编辑助手)功能、Semantic Search(语义搜索)及 knowledge retrieval(知识检索)API,打造基于自然语言搜索与 RAG(检索增强生成)的视频剪辑体验,还实现了产品在不同硬件芯片上的 AI 功能性能提升和 AI 能力的本地化运行升级。

IBM 企业级 AI 智能体平台 watsonx Orchestrate 落地[14]

IBM 强调 AI 进入 "落地马拉松",重点支持企业自定义智能体规模化应用,发布 watsonx Orchestrate 平台,基于开源模型,支持复杂工作流自动化,已与 Adobe、AWS、Microsoft 等集成。

PPIO 推出企业私有化部署解决方案[15]

全球 AI 基础设施服务商 PPIO 派欧云正式推出针对大语言模型的企业私有化部署解决方案,通过 "专用 GPU 集群 + 完全托管" 模式,为企业构建自主可控的高性能 AI 部署平台,致力于让企业以更低的成本、更高的效率实现 AI 应用规模化落地。

3.其他动态

OpenAI Operator[16] 升级为 o3 模型 :浏览器交互更稳定、推理更精准,支持填写表单与网页操作任务。

特斯拉展示 Optimus 人形机器人 [17] 做家务的能力,如扔垃圾、扫地、炒菜等。

北京大学正式上线全球首个覆盖 "读文献 - 做计算 - 做实验 - 多学科协同" 的 AI 科研平台------Science Navigator[18]

京东工业在上海发布行业首个以供应链为核心的工业大模型------Joy industrial[19]。通过 "工业大模型+供应链场景应用" 双引擎,构建从底层算力、算法、数据到应用的全栈产品矩阵,助力产业降本、增效、合规、保供。

英伟达 CEO 黄仁勋在 Computex 2025 大会上推出下一代 Grace Blackwell GB300 AI 服务器系统 [20],基于升级版 Blackwell 芯片,推理性能提升 1.5 倍,HBM 内存增加 1.5 倍,网络能力翻倍。

火山引擎推出豆包 · 语音播客模型 [21],具有低成本、高时效、强互动的特点。

英特尔 [22] 在 Computex 2025 发布面向专业人士的全新英特尔锐炫™ Pro B 系列 GPU(B60 和 B50),基于 Xe2 架构,专为 AI 推理和专业工作站设计。同时提供 Gaudi 3 AI 加速器 PCIe 卡和机架级系统新部署方案。

GIGABYTE[23] 在 COMPUTEX 2025 展示升级版 GIGAPOD GPU 集群(支持 AMD Instinct MI325X、NVIDIA HGX H200)、全球首秀 GIGAPOD 直接液冷(DLC)解决方案、符合 OCP 标准的多种服务器以及面向边缘 AI 的 Jetson Orin 嵌入式系统及集成 NPU 的 BRIX 迷你 PC。

Intel 显卡携手蓝戟推出 GUNNIR Intel Arc Pro B60 TF 24G 专业级显卡 [24],该产品搭载 Xe2 微架构、24GB 大显存,直击 AI 开发、深度学习、三维影视渲染等高负载场景的算力痛点。

英特尔在 GitHub 发布 AI Assistant Builder[25] 公开测试版,这是一个轻量级开放软件框架,用于在英特尔 AI PC 上本地构建和运行自定义 AI 代理。

4.开源项目

Mistral 发布编程专用 开源 AI 模型 Devstral[26]

Mistral AI 与 All Hands AI 合作推出 240 亿参数的 AI 模型 Devstral,专为高级软件工程任务设计,处于 "研究预览" 阶段,以 Apache 2.0 许可发布,可商用。

Devstral 在 SWE-Bench Verified 基准测试中得分 46.8%,超越部分闭源模型。能在单张 RTX 4090 显卡或 32GB RAM 的 Mac 上运行,降低硬件门槛。

微软研究院推出 Magentic-UI,以人为中心的 AI 智能体研究原型[27]

微软研究院发布 Magentic-UI 研究原型,是以人为中心的 AI 智能体,通过网页浏览器实时协助用户完成复杂网络任务。

基于 Magentic-One 多智能体系统,由 AutoGen 框架驱动,具备协同规划、协同任务、行为防护和计划学习四大核心功能。

韩国 Kakao 推出 4 种开源 Kanana 语言模型[28]

Kakao 在开发者平台 "Hugging Face" 上将其自主开发的人工智能(AI)模型 "Kanana 8B" 和 "Kanana 2.1B" 作为开源发布,共推出四种型号,基于 Apache 2.0 许可证,任何人都可对其进行自由修改和商用。

相较于今年 2 月推出的 "Kanana Nano 2.1B" 模型,此次发布的模型性能有明显改进。

西北大学科研团队发布自动识别与量化动物个体行为的开源 AI 框架[29]

西北大学郭松涛团队基于行为学的分析原理,利用人工智能技术,设计了自动识别与量化动物个体行为的开源 AI 框架,可广泛应用于圈养动物日常活动规律监测和关键行为异常预警、野生动物行为数据分析研究等领域。

VS Code 宣布 GitHub Copilot Chat 扩展开源[30]

Visual Studio Code 官方团队宣布,GitHub Copilot Chat 扩展将以 MIT 协议开源,并将关键 AI 能力重构入 VS Code 核心代码,强化社区协作和 AI 编辑器开发透明度。

Hugging Face 开源 Open Computer Agent (OCA)[31]

Hugging Face 宣布开源 Open Computer Agent (OCA),设计用于虚拟 Linux 环境自动化任务执行,支持开发者和研究人员定制复杂任务流。

NVIDIA 开源物理 AI 数据集[32]

NVIDIA 发布全新技术,其中包括开源物理 AI 数据集,包含用于开发 GR00T N 模型的 24,000 条高质量人形机器人运动轨迹数据。

微软研究院推出 Magentic - UI[33]

微软研究院发布 Magentic-UI 开源研究原型,是以人为中心的 AI 智能体,通过网页浏览器实时协助用户完成复杂网络任务。基于 Magentic-One 多智能体系统,由 AutoGen 框架驱动,具备协同规划、协同任务、行为防护和计划学习四大核心功能。

B 站团队开源动漫视频生成模型 Index-AniSora[34]

B 站团队开源动漫视频生成模型 Index-AniSora。模型可一键创建多种动漫风格视频片段,涵盖系列剧集、中国原创动画、漫画改编等。

AniSora 拥有超 1000 万高质量数据,引入时空掩码模块,支持图生视频、帧插值等关键功能。评测数据集包含 948 段多样化动画视频,人物与运动一致性均达 SOTA。

5.投资融资

Persist AI 完成 1200 万美元 A 轮融资[35]

Persist AI 宣布完成 1200 万美元 A 轮融资,旨在通过 "云实验室" 加速药物配方开发。

清华系具身大脑公司「千诀科技」累计融资数亿规模[36]

清华系具身智能技术公司「千诀科技」完成新一轮 Pre-A + 轮融资,累计融资数亿元,投资方包括钧山投资、祥峰投资和石溪资本等。本轮融资将用于核心技术演进、产品标准化及产业化交付能力提升。

公司由清华大学自动化系及相关人工智能研究机构的核心成员创立,是国内唯一可对标美国 Physical Intelligence 公司的企业。

魔法原子再获数亿元融资,将解锁千个落地场景[37]

具身智能机器人公司魔法原子完成新一轮数亿元战略融资,投资方包括禾创致远、芯联资本等产业资本及华映资本等财务投资人。

新资金将用于核心技术研发、VLA 模型搭建及加速机器人在工业、商业场景落地。

魔法原子旗下人形机器人 "小麦" 已进驻工厂产线实训,在商场门店、会展服务、新闻传媒等场景展开实践。

面壁智能获新一轮数亿元融资,引领端侧大模型高效发展与应用普及[38]

面壁智能完成新一轮数亿元融资,由洪泰基金、国中资本、清控金信和茅台基金联合投资。

面壁智能专注于打造高效大模型,端侧全模态模型面壁小钢炮 MiniCPM-o 2.6 多项能力达国际领先水平,系列模型全平台下载量累计破 1000 万。

面壁智能发布了业界首个智能座舱纯端侧汽车助手 cpmGO,与多家车企合作实现量产车型定点。

美图公司与阿里巴巴达成战略合作并获得 2.5 亿美元投资[39]

美图公司宣布与阿里巴巴达成战略合作并获得 2.5 亿美元可转债投资。

协议为期 3 年,年利率 1%,阿里巴巴可按每股 6.00 港元的价格将可转债转换为美图股票。

双方将在电商平台、AI 技术、云计算等领域展开合作,阿里巴巴将优先推广美图 AI 电商工具,协助美图开发电商生图及生视频工具,提升商家营销和运营效率。

尚跃智能完成新一轮战略型股权融资[40]

尚跃智能科技和国智领航(北京)信息科技研究院完成战略股权融资,本轮融资由国智领航(北京)信息科技研究院发起。

战略融资将主要用于推进人工智能通识教育。

光帆科技获得 1.3 亿人民币天使 + 融资[41]

北京光帆科技有限公司获得 1.3 亿人民币天使 + 融资,参与投资的机构包括 Shokz 韶音科技、同歌创投等,投后估值 5 亿人民币。

光帆科技是一家基于硬件产品的 AI 应用服务商。

谷歌收购 AI 聊天机器人公司相关情况受美国司法部调查[42]

美国司法部正在调查 Alphabet 旗下谷歌,审查其与一家热门聊天机器人公司 Character.AI 的人工智能技术使用协议是否违反了反垄断法。

根据去年与谷歌达成的协议,Character.AI 的创始人加入了谷歌,同时谷歌也获得了使用该公司技术的非独占性许可。

OpenAI 员工股权捐赠受阻[43]

CNBC 在 5 月 23 日报道称,因公司股权结构特殊,OpenAI 员工难以将所持股权捐赠给慈善机构,引发员工不满。

6.观点洞察

金融业 AI 应用与变革流畅性[44]

艾扬斯最近的一项调查发现,报告指出 90% 欧洲金融服务企业已用 AI,但 "变革流畅性" 而非技术本身是生存关键。需通过共创变革、容忍试错将 AI 创新转化为增长。

Elon Musk 论 AI 芯片、电力瓶颈与创新[45]

马斯克在 CNBC 采访中表示,目前 AI 瓶颈是芯片,很快转向电力,预测 2026 年中可能电力不足。他认为创新需要质疑权威,是美国优势所在。

References

1\] 谷歌 I/O 2025 大会:*https://www.wired.com/story/everything-google-announced-at-io-2025/* \[2\]Claude 4:*https://www.anthropic.com/news/claude-4* \[3\]OpenAI 官宣收购 io:*https://mp.weixin.qq.com/s/zpQw0tC2dIERe1DH30kHvw* \[4\] 微软 Build 2025 大会:*https://news.microsoft.com/build-2025/* \[5\] 星际之门阿联酋:*https://www.cnn.com/2025/05/22/tech/nvidia-openai-stargate-ai-uae-intl* \[6\] 豆包:*https://mp.weixin.qq.com/s/JSjCuc3LhigXndkUsjBI3Q* \[7\] 混元游戏:*https://mp.weixin.qq.com/s/9wF-qaQ9LSW_BEah_6uYTg* \[8\]NoCode:*https://nocode.cn/* \[9\]Agent Neo:*https://flowith.net/* \[10\]QBot AI 浏览器:*https://mp.weixin.qq.com/s/FdRY9KDJTuigl1aZQnzrBA* \[11\]Responses API:*https://www.ithome.com/0/855/067.htm* \[12\] 天工超级智能体:*https://mp.weixin.qq.com/s/5vqrIevfZRWULzTwtHK7nQ* \[13\] 万兴科技 Filmora:*https://mp.weixin.qq.com/s/BFSSfhxWYAZk6ucIuLgAGA* \[14\]watsonx Orchestrate:*https://china.newsroom.ibm.com/2025-05-21-IBM-AI-,-AI* \[15\]PPIO:*https://www.csdn.net/article/2025-05-21/148120264* \[16\]OpenAI Operator:*https://www.bleepingcomputer.com/news/artificial-intelligence/openai-confirms-operator-agent-is-now-more-accurate-with-o3/* \[17\] 特斯拉 Optimus 人形机器人:*https://www.ithome.com/0/854/951.htm* \[18\]Science Navigator:*https://mp.weixin.qq.com/s/FigAdwEqPjC_ZPT4HUdShw* \[19\]Joy industrial:*https://mp.weixin.qq.com/s/AAQ7QwrdpxyLbWeE96tkhA* \[20\]Grace Blackwell GB300 AI 服务器系统:*https://www.sohu.com/a/897254047_166680* \[21\] 豆包 · 语音播客模型:*https://mp.weixin.qq.com/s/-paLFjwLYf-lpPJYx_5DNw* \[22\] 英特尔:*https://mp.weixin.qq.com/s/X5JN9OdSsWoSUDSUOYNzbw* \[23\]GIGABYTE:*https://www.businesswire.com/news/home/20250428432769/zh-CN* \[24\]GUNNIR Intel Arc Pro B60 TF 24G 专业级显卡:*https://www.toutiao.com/article/7506105172716831273/?upstream_biz=doubao\&source=m_redirect* \[25\]AI Assistant Builder:**https://github.com/intel/intel-ai-assistant-builder** \[26\]Devstral:*https://mistral.ai/news/devstral* \[27\]Magentic-UI:*https://www.microsoft.com/en-us/research/blog/magentic-ui* \[28\]Kanana:*https://huggingface.co/kakaocorp/kanana-1.5-8b-instruct-2505#kanana-15* \[29\] 西北大学开源 AI 框架:*https://www.nwu.edu.cn/info/1192/40669.htm* \[30\]GitHub Copilot Chat 扩展:*https://code.visualstudio.com/blogs/2025/05/19/openSourceAIEditor* \[31\]Open Computer Agent:*https://aishwaryasrinivasan.substack.com/p/this-week-in-ai-week-of-may-16th* \[32\] 物理 AI 数据集:*https://www.eetrend.com/content/2025/100591434.html* \[33\]Magentic - UI:*https://www.microsoft.com/en-us/research/blog/magentic-ui* \[34\]AniSora:*https://github.com/bilibili/Index-anisora* \[35\]Persist AI:*https://www.donews.com/news/detail/8/5227109.html* \[36\] 千诀科技:*https://36kr.com/p/3297801463253256* \[37\] 魔法原子:*https://zhidx.com/p/480962.html* \[38\] 面壁智能:*https://mp.weixin.qq.com/s/AT9quVBhxP5nZcidwFCagA* \[39\] 美图:*https://mp.weixin.qq.com/s/XYeDiunAma353kXSaehIKQ* \[40\] 尚跃智能:*https://finance.sina.cn/tech/2025-05-23/detail-inexpvsa8697669.d.html* \[41\] 光帆科技:*https://www.toutiao.com/article/7506859239214793250/?upstream_biz=doubao\&source=m_redirect* \[42\] 谷歌收购 AI 聊天机器人公司受调查:*https://www.toutiao.com/article/7507478759025443338/?upstream_biz=doubao\&source=m_redirect* \[43\]OpenAI 员工股权捐赠受阻:*https://www.cnbc.com/2025/05/23/openai-employees-thwarted-in-efforts-to-donate-equity-in-ai-startup.html* \[44\] 金融业 AI 应用:*https://www.forbes.com/sites/kathleenwalch/2025/05/23/navigating-ai-disruption-and-the-new-competitive-edge-in-finance/* \[45\] 马斯克:*https://www.cnbc.com/2025/05/20/elon-musk-says-he-expects-to-keep-buying-gpus-from-nvidia-and-amd.html*

相关推荐
FnTop26 分钟前
为什么共现矩阵是高维稀疏的
人工智能·线性代数·矩阵
猴哥聊项目管理27 分钟前
什么是DevOps的核心目标?它如何解决传统开发与运维之间的冲突?
运维·开源·项目管理·产品经理·devops·项目经理·软件
AIGC_ZY1 小时前
DiT、 U-Net 与自回归模型的优势
人工智能·数据挖掘·回归
这张生成的图像能检测吗1 小时前
OpenGAN:基于开放数据生成的开放集识别
人工智能·pytorch·深度学习·算法·机器学习·生成对抗网络·聚类
chatshare镜像1 小时前
GPT-4o 风格提示词案例大全(持续更新 ing...)
人工智能
熵减画眉1 小时前
科技趋势分析系统(BBC)技术全解
人工智能·python·科技·机器学习·unity·自然语言处理·游戏引擎
LaughingZhu1 小时前
PH热榜 | 2025-05-24
前端·人工智能·经验分享·搜索引擎·产品运营
群联云防护小杜1 小时前
动态防御新纪元:AI如何重构DDoS攻防成本格局
人工智能·重构·ddos
DolphinScheduler社区1 小时前
Apache DolphinScheduler存储系统详解| AI生成技术文档系列
开源·api·ai生成·存储系统·海豚调度
Jamence1 小时前
多模态大语言模型arxiv论文略读(九十四)
论文阅读·人工智能·深度学习·语言模型·论文笔记