OpenAudio S1:支持多语言情感控制的专业级 TTS 模型

OpenAudio S1:支持多语言情感控制的专业级 TTS 模型

OpenAudio S1 是由 OpenAudio 团队开发的文本转语音(TTS)模型,它能像专业配音演员一样生成语音。

该模型支持丰富的情感和语气精细控制,涵盖英语、中文、日语、德语、法语等多种语言。价格非常良心,仅为每百万字节 15 美元(约合每小时 0.8 美元)。

佬们可以在官方博客[1]查看技术报告,或者在FishAudio[2]上直接在线体验。

三花的小视频宝也支持这个模型!

LumaAI 发布 Modify Video:一键重塑视频风格与内容

LumaAI 发布 Modify Video 功能,从官方演示视频来看[3],效果非常的好。

该功能能够智能重塑视频中的风格设定、角色形象和场景布局。

Stability AI 发布 Virtual Camera v1.1:单图生成运镜视频

Stable Diffusion 开发团队 SAI(Stability AI) 正式推出Virtual Camera v1.1 [4] 版本,佬们可以在 Hugging Face 平台[5]上体验这个自由相机轨迹生成模型。

该模型支持通过单张图片生成多种专业运镜视频的能力,也支持输入多视角实现更好的视频生成。

Curosr 发布 v1.0 版本

Cursor 1.0 全面开放了 Background Agent 让所有用户都能使用远程编程助手,新增的 BugBot 可自动审查 GitHub PR 并快速修复问题,Jupyter Notebook 现已支持通过 Agent 直接编辑多代码单元格,实验性的 记忆功能 能保存对话上下文供后续参考,同时简化了 MCP 服务器的一键安装 并支持 OAuth 认证,聊天窗口现在能直接渲染图表和表格,全新的仪表盘还提供了更详细的用量统计分析。

相关推荐
ToTensor44 分钟前
Tree of Thoughts:让大语言模型像人类一样思考
人工智能·语言模型·自然语言处理
shangjian0073 小时前
AI大模型-评价指标-相关术语
人工智能·算法
江河地笑4 小时前
opencv、cmake、vcpkg
人工智能·opencv·计算机视觉
海边夕阳20064 小时前
【每天一个AI小知识】:什么是卷积神经网络?
人工智能·经验分享·深度学习·神经网络·机器学习·cnn
一只会写代码的猫5 小时前
可持续发展中的绿色科技:推动未来的环保创新
大数据·人工智能
胡萝卜3.05 小时前
掌握C++ map:高效键值对操作指南
开发语言·数据结构·c++·人工智能·map
松岛雾奈.2306 小时前
机器学习--PCA降维算法
人工智能·算法·机器学习
5***79006 小时前
机器学习社区机器学习社区:推动技术进步与创新的引擎
人工智能·机器学习
物联网软硬件开发-轨物科技6 小时前
【轨物交流】海盐县组织部调研轨物科技 深化产学研用协同创新
人工智能·科技
Olafur_zbj6 小时前
【AI】矩阵、向量与乘法
人工智能·线性代数·矩阵