OpenAudio S1:支持多语言情感控制的专业级 TTS 模型

OpenAudio S1:支持多语言情感控制的专业级 TTS 模型

OpenAudio S1 是由 OpenAudio 团队开发的文本转语音(TTS)模型,它能像专业配音演员一样生成语音。

该模型支持丰富的情感和语气精细控制,涵盖英语、中文、日语、德语、法语等多种语言。价格非常良心,仅为每百万字节 15 美元(约合每小时 0.8 美元)。

佬们可以在官方博客[1]查看技术报告,或者在FishAudio[2]上直接在线体验。

三花的小视频宝也支持这个模型!

LumaAI 发布 Modify Video:一键重塑视频风格与内容

LumaAI 发布 Modify Video 功能,从官方演示视频来看[3],效果非常的好。

该功能能够智能重塑视频中的风格设定、角色形象和场景布局。

Stability AI 发布 Virtual Camera v1.1:单图生成运镜视频

Stable Diffusion 开发团队 SAI(Stability AI) 正式推出Virtual Camera v1.1 [4] 版本,佬们可以在 Hugging Face 平台[5]上体验这个自由相机轨迹生成模型。

该模型支持通过单张图片生成多种专业运镜视频的能力,也支持输入多视角实现更好的视频生成。

Curosr 发布 v1.0 版本

Cursor 1.0 全面开放了 Background Agent 让所有用户都能使用远程编程助手,新增的 BugBot 可自动审查 GitHub PR 并快速修复问题,Jupyter Notebook 现已支持通过 Agent 直接编辑多代码单元格,实验性的 记忆功能 能保存对话上下文供后续参考,同时简化了 MCP 服务器的一键安装 并支持 OAuth 认证,聊天窗口现在能直接渲染图表和表格,全新的仪表盘还提供了更详细的用量统计分析。

相关推荐
小程故事多_806 分钟前
OpenClaw工具引擎架构全解析,AI Agent的“双手”如何落地实操
人工智能·架构·aigc·ai编程·openclaw
qq_4523962310 分钟前
【AI 架构师】第十篇:Agent 工业化部署 —— 从 FastAPI 到云端全链路监控
网络·人工智能·ai·fastapi
前端摸鱼匠12 分钟前
【AI大模型春招面试题11】什么是模型的“涌现能力”(Emergent Ability)?出现条件是什么?
人工智能·算法·ai·自然语言处理·面试·职场和发展
新缸中之脑13 分钟前
如何合法地逆向SynthID
人工智能
剑穗挂着新流苏3121 小时前
115_PyTorch 实战:从零搭建 CIFAR-10 完整训练与测试流水线
人工智能·pytorch·深度学习·神经网络
Veggie261 小时前
【Java深度学习】PyTorch On Java 系列课程 第八章 17 :模型评估【AI Infra 3.0】[PyTorch Java 硕士研一课程]
java·人工智能·深度学习
链上杯子2 小时前
《2026 LangChain零基础入门:用AI应用框架快速搭建智能助手》第8课(完结篇):小项目实战 + 部署 —— 构建网页版个人知识库 AI 助手
人工智能·langchain
东方不败之鸭梨的测试笔记2 小时前
AI生成测试用例方案
人工智能·测试用例
笨手笨脚の3 小时前
AI 基础概念
人工智能·大模型·prompt·agent·tool
飞睿科技3 小时前
解析 ESP-AirPuff 泡芙一号的 ESP32-P4 大模型 AI 智能体方案
人工智能