技术栈
音频生成
北海有座岛
13 天前
语音合成
·
tts
·
音频生成
·
星图gpu
VibeVoice Pro声音矩阵:25种音色一键切换体验
你有没有试过这样的情境:刚写完一段产品介绍文案,想立刻听听它读出来是什么效果?或者正在为短视频配音发愁——男声太沉闷、女声又不够专业,换一个音色要重新导出、再导入剪辑软件,反复折腾十几分钟?更别说多语种内容了:英语播客配完,还得切到日语版本,调参数、试效果、调节奏……整个流程像在调试一台老式收音机。
算家云
2 年前
人工智能
·
深度学习
·
aigc
·
模型搭建
·
音频生成
·
算家云
如何在算家云搭建Aatrox-Bert-VITS2(音频生成)
Aatrox - Bert -VITS2 模型是一种基于深度学习的语音合成系统,结合了 BERT 的预训练能力和 VITS2 的微调技术,旨在实现高质量的个性化语音合成。
算家云
2 年前
人工智能
·
大模型
·
算力
·
tts
·
文本转语音
·
语音转换
·
音频生成
GPT-SOVIT模型部署指南
强大的小样本语音转换和文本转语音 WebUI。具有以下特征:测试环境用户可以在这里下载所有这些模型。也可从modelscope下载:
我的运维人生
2 年前
深度学习
·
自然语言处理
·
语音合成
·
audiolm
·
音频生成
AudioLM音频生成模型:技术革新与应用前景
AudioLM作为一种革命性的音频生成模型,结合了深度学习和自然语言处理的先进技术,能够生成高质量、逼真的音频内容。本文旨在深入探讨AudioLM的技术原理、工作机制、应用场景以及其对音频生成领域的深远影响。
知来者逆
2 年前
人工智能
·
stable diffusion
·
音视频
·
stability ai
·
音频生成
Stability AI 推出稳定音频 2.0:为创作者提供先进的 AI 生成音频
Stability AI 的发布再次突破了创新的界限。这一尖端模型以其前身的成功为基础,引入了一系列突破性的功能,有望彻底改变艺术家和音乐家创建和操作音频内容的方式。
我是有底线的