Decart AI 发布 MirageLSD：号称零延迟的实时视频生成模型

谷歌 Veo 3 $1$ 现已推出付费预览 API，该 API 目前可在 Gemini API 和 AI Studio 中付费使用。每次调用可生成 8 秒时长的视频内容，提供带音频和不带音频两种版本选择。

不过价格非常贵啊 - 带音频版本每秒收费，不带音频版本也要每秒0.5。

OpenAI 重磅推出 ChatGPT agent 智能代理系统，这是一个通用 agentic 系统，配备了完整的工具套件，包括视觉浏览器、文本浏览器、终端和直连API，能够动态选择最佳路径，包括过滤结果、运行代码，甚至生成幻灯片和电子表格，同时在各个步骤中保持完整的任务上下文。

只有 Pro、Plus 和 Team 用户才可以使用，完整介绍可以看官方推文。

AWS 最新推出的 Kiro $2$ 是一款 AI IDE（类似 Cursor），其最大创新点在于采用 spec-driven（规范驱动）工作流 - 强调文档先行，而非即兴编程。

作为基于 VSCode 的套壳产品，Kiro 完美兼容现有插件生态。目前搭载的是 Anthropic 的 Sonnet 3.7 和 4.0 大模型。

目前还在预览阶段，完全免费但需要排队 Waitlist。不过官方已经画好大饼了：未来定价分为两档 - Kiro Pro 19 刀/月给 1000 次交互，Pro+ 39 刀/月给 3000 次交互

MirageLSD 是 Decart AI 发布的首个 Live-Stream Diffusion（实时流式扩散，简称 LSD）AI 视频模型，能够实现无限、实时的视频生成。

官方宣称延迟低至 40ms（不过没说明具体硬件配置），实际生成效果嘛...只能说还有进步空间。你可以在官方技术报告 $3$ 查看完整技术细节。

音乐生成AI领跑者Suno $4$ 刚刚发布了 4.5+ 版本更新，带来了三项功能：

话说 Suno 好像好久都没有更新底模了。

v0 平台 API $5$ 现已推出公开测试版！现在你可以通过官方 SDK 将 v0 的功能无缝集成到自己的系统中。

谷歌DeepMind官方公告 $6$ 显示，谷歌搜索的AI模式现已支持 Gemini 2.5 Pro，因为支持推理了，可以用来解决非常复杂的数学问题。