Decart AI 发布 MirageLSD:号称零延迟的实时视频生成模型

谷歌 Veo 3 视频生成 API 开放付费预览

谷歌 Veo 3[1] 现已推出付费预览 API,该 API 目前可在 Gemini API 和 AI Studio 中付费使用。每次调用可生成 8 秒时长的视频内容,提供带音频和不带音频两种版本选择。

不过价格非常贵啊 - 带音频版本每秒收费 ,不带音频版本也要每秒0.5。

OpenAI 发布全能 ChatGPT Agent

OpenAI 重磅推出 ChatGPT agent 智能代理系统,这是一个通用 agentic 系统,配备了完整的工具套件,包括视觉浏览器、文本浏览器、终端和直连API,能够动态选择最佳路径,包括过滤结果、运行代码,甚至生成幻灯片和电子表格,同时在各个步骤中保持完整的任务上下文。

只有 Pro、Plus 和 Team 用户才可以使用,完整介绍可以看官方推文

AWS Kiro:文档先行的 AI IDE

AWS 最新推出的 Kiro[2] 是一款 AI IDE(类似 Cursor),其最大创新点在于采用 spec-driven(规范驱动)工作流 - 强调文档先行,而非即兴编程。

作为基于 VSCode 的套壳产品,Kiro 完美兼容现有插件生态。目前搭载的是 Anthropic 的 Sonnet 3.7 和 4.0 大模型。

目前还在预览阶段,完全免费但需要排队 Waitlist。不过官方已经画好大饼了:未来定价分为两档 - Kiro Pro 19 刀/月给 1000 次交互,Pro+ 39 刀/月给 3000 次交互

Decart AI 发布 MirageLSD:号称零延迟的实时视频生成模型

MirageLSD 是 Decart AI 发布的首个 Live-Stream Diffusion(实时流式扩散,简称 LSD)AI 视频模型,能够实现无限、实时的视频生成。

官方宣称延迟低至 40ms(不过没说明具体硬件配置),实际生成效果嘛...只能说还有进步空间。你可以在官方技术报告[3]查看完整技术细节。

Suno AI 4.5+ 更新:人声替换/伴奏翻转/歌单灵感三大功能

音乐生成AI领跑者Suno[4]刚刚发布了 4.5+ 版本更新,带来了三项功能:

  • 人声替换(Vocal Swap):用户可以轻松替换歌曲中的人声部分,为歌曲注入新的声音风格。
  • 伴奏翻转(Flip Instrumentals):用户可以对伴奏进行重新编排或翻转,创造出全新的音乐风格。
  • 从播放列表获取灵感(Spark a Song from Any Playlist):用户可以从任何播放列表中获取灵感,快速生成新的歌曲创意。

话说 Suno 好像好久都没有更新底模了。

v0 平台 API 公开测试版上线

v0 平台 API[5] 现已推出公开测试版!现在你可以通过官方 SDK 将 v0 的功能无缝集成到自己的系统中。

谷歌搜索 AI 模式现在支持 Gemini 2.5 Pro

谷歌DeepMind官方公告[6]显示,谷歌搜索的AI模式现已支持 Gemini 2.5 Pro,因为支持推理了,可以用来解决非常复杂的数学问题。

相关推荐
ajassi20003 小时前
开源 Arkts 鸿蒙应用 开发(十八)通讯--Ble低功耗蓝牙服务器
华为·开源·harmonyos
工业甲酰苯胺4 小时前
扣子(Coze),开源了!Dify 天塌了
开源
张3蜂14 小时前
Stagehand深度解析:从开源自动化工具到企业级RPA平台的演进之路
开源·自动化·rpa
ajassi200019 小时前
开源 Arkts 鸿蒙应用 开发(十六)自定义绘图控件--波形图
华为·开源·harmonyos
A尘埃20 小时前
金融项目高可用分布式TCC-Transaction(开源框架)
分布式·金融·开源
OpenAnolis小助手1 天前
朗空量子与 Anolis OS 完成适配,龙蜥获得抗量子安全能力
安全·开源·操作系统·龙蜥社区·龙蜥生态
小白狮ww1 天前
蛋白质设计新高度,RFdiffusion 实现从零设计高亲和力蛋白质
人工智能·python·开源
算家计算2 天前
130亿参数开源之巅!HunyuanVideo本地部署教程:导演级运镜 × 物理级流畅
人工智能·开源·aigc
白书宇2 天前
5.从零开始写LINUX内核--从实模式到保护模式的过渡实现
linux·汇编·数据库·开源
NocoBase2 天前
GitHub 上 Star 数量前 18 的开源 AI Agent 项目
人工智能·开源·openai