Rectified Flow Matching 语音合成,上海交大开源

论文地址:

https://arxiv.org/abs/2309.05027

演示地址:

https://cantabile-kwok.github.io/VoiceFlow/

代码地址:

https://github.com/cantabile-kwok/VoiceFlow-TTS(持续更新中)

VoiceFlow框图

文章做了两组比较:

  1. rectified flow matching 与 grad-tts 对比效果

  2. rectified flow matching 与 flow matching 对比效果

VoiceFlow 只需要两步即可达到非常好的效果,见:

https://cantabile-kwok.github.io/VoiceFlow/

项目实现的参考信息,可以看到该项目做的工作很完备

相关推荐
AI科技星5 分钟前
接近光速运动下的光速不变性:基于张祥前统一场论的推导与验证
数据结构·人工智能·经验分享·算法·计算机视觉
864记忆27 分钟前
opencv图像预处理函数的功能与作用
人工智能·opencv·计算机视觉
神仙别闹1 小时前
基于C#实现(WinForm)数值分析(图像扭曲变形)
人工智能
光影少年1 小时前
AIGG人工智能生态及学习路线和应用领域
人工智能·学习
俊男无期1 小时前
【AI入门】什么是训练和推理
人工智能
递归不收敛1 小时前
多模态学习大纲笔记(未完成)
人工智能·笔记·学习·自然语言处理
碧海银沙音频科技研究院1 小时前
DiVE长尾识别的虚拟实例蒸馏方法
arm开发·人工智能·深度学习·算法·音视频
彩云回1 小时前
堆叠泛化(Stacking)
人工智能·机器学习·1024程序员节
AI浩1 小时前
FMC-DETR:面向航拍视角目标检测的频域解耦多域协同方法
人工智能·目标检测·计算机视觉