Rectified Flow Matching 语音合成,上海交大开源

论文地址:

https://arxiv.org/abs/2309.05027

演示地址:

https://cantabile-kwok.github.io/VoiceFlow/

代码地址:

https://github.com/cantabile-kwok/VoiceFlow-TTS(持续更新中)

VoiceFlow框图

文章做了两组比较:

  1. rectified flow matching 与 grad-tts 对比效果

  2. rectified flow matching 与 flow matching 对比效果

VoiceFlow 只需要两步即可达到非常好的效果,见:

https://cantabile-kwok.github.io/VoiceFlow/

项目实现的参考信息,可以看到该项目做的工作很完备

相关推荐
qq_436962184 分钟前
AI数据分析的利器:解锁BI工具的无限潜力
人工智能·数据挖掘·数据分析·ai数据分析
热水养鲨鱼10 分钟前
Java实现HTML转PDF(deepSeekAi->html->pdf)
人工智能·pdf·html
灏瀚星空12 分钟前
Python在AI虚拟教学视频开发中的核心技术与前景展望
人工智能·python·音视频
qyresearch_15 分钟前
全球碳化硅晶片市场深度解析:技术迭代、产业重构与未来赛道争夺战(2025-2031)
大数据·人工智能
豆芽8191 小时前
图解YOLO(You Only Look Once)目标检测(v1-v5)
人工智能·深度学习·学习·yolo·目标检测·计算机视觉
算力云1 小时前
深度剖析!GPT-image-1 API 开放对 AI 绘画技术生态的冲击!
人工智能·openai图像生成模型·gpt-image-1
孤寂码农_defector1 小时前
AI 人工智能模型:从理论到实践的深度解析⚡YQW · Studio ⚡【Deepseek】【Chat GPT】
人工智能
北上ing1 小时前
从FP32到BF16,再到混合精度的全景解析
人工智能·pytorch·深度学习·计算机视觉·stable diffusion
小奕同学A2 小时前
数字化技术的五个环节:大数据、云计算、人工智能、区块链、移动互联网
大数据·人工智能·云计算
Eric.Lee20212 小时前
数据集-目标检测系列- F35 战斗机 检测数据集 F35 plane >> DataBall
人工智能·算法·yolo·目标检测·计算机视觉