使用GPT-SoVITS训练语音模型

1.项目演示

阅读单句话

1725352713141

读古诗

1725353700203


2.项目环境

开发环境:linux

机器配置如下:实际使用率百分之二十几,

3.开发步骤

1.首先是准备数据集,要求是wav格式,一到两个小时即可,

2.配置GPT-SoVITS需要的环境,

这里要注意,如果是windows直接下载整合包,linux用户则需要先把项目克隆到本地,然后再将模型下载下来放进去,才能继续成功运行。

整合包及模型下载链接 (yuque.com)

Linux的步骤在下面,

2.1 克隆项目

进入项目地址,点击code,再点击复制按钮将链接复制下来。

之后到自己的服务器里去,执行即可,(ps:可以先创建一个文件夹,git初始化这些老生常谈的事情,再放进去。不过我们的主要目的是用而不是修改。)

复制代码
git clone https://github.com/RVC-Boss/GPT-SoVITS.git

github项目链接如下:

RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning) (github.com)

2.2 安装运行所需的库

进入服务器,创建虚拟环境

2.3 将下载好的模型放入对应的位置

3.进行数据的初步处理

4.进行所需模型数据的提取

5.开始训练模型

6.训练完成!开始推理。

相关推荐
一点.点1 小时前
SafeDrive:大语言模型实现自动驾驶汽车知识驱动和数据驱动的风险-敏感决策——论文阅读
人工智能·语言模型·自动驾驶
concisedistinct1 小时前
如何评价大语言模型架构 TTT ?模型应不应该永远“固定”在推理阶段?模型是否应当在使用时继续学习?
人工智能·语言模型·大模型
找了一圈尾巴1 小时前
AI Agent-基础认知与架构解析
人工智能·ai agent
jzwei0231 小时前
Transformer Decoder-Only 参数量计算
人工智能·深度学习·transformer
小言Ai工具箱1 小时前
PuLID:高效的图像变脸,可以通过文本提示编辑图像,通过指令修改人物属性,个性化文本到图像生成模型,支持AI变脸!艺术创作、虚拟形象定制以及影视制作
图像处理·人工智能·计算机视觉
白熊1881 小时前
【计算机视觉】基于深度学习的实时情绪检测系统:emotion-detection项目深度解析
人工智能·深度学习·计算机视觉
TextIn智能文档云平台1 小时前
PDF文档解析新突破:图表识别、公式还原、手写字体处理,让AI真正读懂复杂文档!
图像处理·人工智能·算法·自然语言处理·pdf·ocr
老任与码1 小时前
Spring AI(2)—— 发送消息的API
java·人工智能·spring ai
AI改变未来1 小时前
智慧城市新力量!AI如何助力社会治理创新?
人工智能·ai·智慧城市·ai应用
Panesle2 小时前
HunyuanCustom:文生视频框架论文速读
人工智能·算法·音视频·文生视频