Rectified Flow Matching 语音合成,上海交大开源

论文地址:

https://arxiv.org/abs/2309.05027

演示地址:

https://cantabile-kwok.github.io/VoiceFlow/

代码地址:

https://github.com/cantabile-kwok/VoiceFlow-TTS(持续更新中)

VoiceFlow框图

文章做了两组比较:

  1. rectified flow matching 与 grad-tts 对比效果

  2. rectified flow matching 与 flow matching 对比效果

VoiceFlow 只需要两步即可达到非常好的效果,见:

https://cantabile-kwok.github.io/VoiceFlow/

项目实现的参考信息,可以看到该项目做的工作很完备

相关推荐
Aspect of twilight4 分钟前
PyTorch DDP分布式训练Pytorch代码讲解
人工智能·pytorch·python
用户5191495848459 分钟前
滥用ESC10:通过注册表配置不当实现权限提升的ADCS攻击分析
人工智能·aigc
黎茗Dawn10 分钟前
DDPM-KL 散度与 L2 损失
人工智能·算法·机器学习
玖日大大14 分钟前
融合浪潮:从 “国产替代” 到 “范式创新” 的必然跃迁
人工智能
tomeasure17 分钟前
INTERNAL ASSERT FAILED at “/pytorch/c10/cuda/CUDACachingAllocator.cpp“:983
人工智能·pytorch·python·nvidia
AI营销快线18 分钟前
AI营销下半场:B2B选型指南
大数据·人工智能
小马爱打代码19 分钟前
Spring AI:文生图:调用通义万相 AI 大模型
java·人工智能·spring
过河卒_zh156676624 分钟前
算法备案最新通知:26年1月批备案号发放名单已锁定,发放前的复审抽审已开始
人工智能·算法·aigc·算法备案
研华科技Advantech30 分钟前
储能AI化的数据瓶颈与破解路径:研华全栈方案实践分析
数据库·人工智能·储能·智能体
Likeadust1 小时前
视频直播点播平台EasyDSS助力企业打造全场景数字化宣传体系
运维·人工智能·音视频