Rectified Flow Matching 语音合成,上海交大开源

论文地址:

https://arxiv.org/abs/2309.05027

演示地址:

https://cantabile-kwok.github.io/VoiceFlow/

代码地址:

https://github.com/cantabile-kwok/VoiceFlow-TTS(持续更新中)

VoiceFlow框图

文章做了两组比较:

  1. rectified flow matching 与 grad-tts 对比效果

  2. rectified flow matching 与 flow matching 对比效果

VoiceFlow 只需要两步即可达到非常好的效果,见:

https://cantabile-kwok.github.io/VoiceFlow/

项目实现的参考信息,可以看到该项目做的工作很完备

相关推荐
HPC_fac130520678161 小时前
以科学计算为切入点:剖析英伟达服务器过热难题
服务器·人工智能·深度学习·机器学习·计算机视觉·数据挖掘·gpu算力
小陈phd3 小时前
OpenCV从入门到精通实战(九)——基于dlib的疲劳监测 ear计算
人工智能·opencv·计算机视觉
Guofu_Liao5 小时前
大语言模型---LoRA简介;LoRA的优势;LoRA训练步骤;总结
人工智能·语言模型·自然语言处理·矩阵·llama
ZHOU_WUYI8 小时前
3.langchain中的prompt模板 (few shot examples in chat models)
人工智能·langchain·prompt
如若1238 小时前
主要用于图像的颜色提取、替换以及区域修改
人工智能·opencv·计算机视觉
老艾的AI世界9 小时前
AI翻唱神器,一键用你喜欢的歌手翻唱他人的曲目(附下载链接)
人工智能·深度学习·神经网络·机器学习·ai·ai翻唱·ai唱歌·ai歌曲
DK221519 小时前
机器学习系列----关联分析
人工智能·机器学习
Robot2519 小时前
Figure 02迎重大升级!!人形机器人独角兽[Figure AI]商业化加速
人工智能·机器人·微信公众平台
浊酒南街10 小时前
Statsmodels之OLS回归
人工智能·数据挖掘·回归