Rectified Flow Matching 语音合成,上海交大开源

论文地址:

https://arxiv.org/abs/2309.05027

演示地址:

https://cantabile-kwok.github.io/VoiceFlow/

代码地址:

https://github.com/cantabile-kwok/VoiceFlow-TTS(持续更新中)

VoiceFlow框图

文章做了两组比较:

  1. rectified flow matching 与 grad-tts 对比效果

  2. rectified flow matching 与 flow matching 对比效果

VoiceFlow 只需要两步即可达到非常好的效果,见:

https://cantabile-kwok.github.io/VoiceFlow/

项目实现的参考信息,可以看到该项目做的工作很完备

相关推荐
冰西瓜60015 小时前
从项目入手机器学习——(三)数据预处理(下)自动编码器
人工智能·机器学习
Blossom.11815 小时前
AI Agent的长期记忆革命:基于向量遗忘曲线的动态压缩系统
运维·人工智能·python·深度学习·自动化·prompt·知识图谱
_codemonster16 小时前
计算机视觉入门到实战系列(十六)基于空间约束的k-means图像分割
人工智能·计算机视觉·kmeans
love530love16 小时前
ComfyUI Hunyuan-3D-2 插件安装问题解决方案
人工智能·windows·python·3d·comfyui·hunyuan-3d-2·pygit2
ldccorpora16 小时前
GALE Phase 1 Chinese Broadcast News Parallel Text - Part 1数据集介绍,官网编号LDC2007T23
人工智能·深度学习·算法·机器学习·自然语言处理
紫小米16 小时前
Agent skill怎么使用?
人工智能·agent·agent skill
Gavin在路上16 小时前
【无标题】
人工智能
ehiway16 小时前
AI芯片技术演进的双轨路径:从通用架构到领域专用的并行演进——指令集优化与电路级重构协同塑造智能计算新生态
人工智能
没学上了16 小时前
Vlm-vit模型
人工智能
沛沛老爹16 小时前
Web开发者转型AI:Agent Skills版本控制与管理实战——从Git到AI技能仓库
java·前端·人工智能·git·架构·rag