使用GPT-SoVITS训练语音模型

1.项目演示

阅读单句话

1725352713141

读古诗

1725353700203


2.项目环境

开发环境:linux

机器配置如下:实际使用率百分之二十几,

3.开发步骤

1.首先是准备数据集,要求是wav格式,一到两个小时即可,

2.配置GPT-SoVITS需要的环境,

这里要注意,如果是windows直接下载整合包,linux用户则需要先把项目克隆到本地,然后再将模型下载下来放进去,才能继续成功运行。

整合包及模型下载链接 (yuque.com)

Linux的步骤在下面,

2.1 克隆项目

进入项目地址,点击code,再点击复制按钮将链接复制下来。

之后到自己的服务器里去,执行即可,(ps:可以先创建一个文件夹,git初始化这些老生常谈的事情,再放进去。不过我们的主要目的是用而不是修改。)

git clone https://github.com/RVC-Boss/GPT-SoVITS.git

github项目链接如下:

RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning) (github.com)

2.2 安装运行所需的库

进入服务器,创建虚拟环境

2.3 将下载好的模型放入对应的位置

3.进行数据的初步处理

4.进行所需模型数据的提取

5.开始训练模型

6.训练完成!开始推理。

相关推荐
Major_xx16 分钟前
装win10系统提示“windows无法安装到这个磁盘,选中的磁盘采用GPT分区形式”解决方法
windows·gpt
闻道且行之17 分钟前
LLaMA-Factory|微调大语言模型初探索(4),64G显存微调13b模型
人工智能·语言模型·llama·qlora·fsdp
喝不完一杯咖啡24 分钟前
【AI时代】可视化训练模型工具LLaMA-Factory安装与使用
人工智能·llm·sft·llama·llama-factory
huaqianzkh1 小时前
理解构件的3种分类方法
人工智能·分类·数据挖掘
后端码匠1 小时前
Spring Boot3+Vue2极速整合:10分钟搭建DeepSeek AI对话系统
人工智能·spring boot·后端
用户231434978141 小时前
使用 Trae AI 编程平台生成扫雷游戏
人工智能·设计
神经美学_茂森1 小时前
神经网络防“失忆“秘籍:弹性权重固化如何让AI学会“温故知新“
人工智能·深度学习·神经网络
大囚长1 小时前
AI工作流+专业知识库+系统API的全流程任务自动化
运维·人工智能·自动化
阿_旭1 小时前
【超详细】神经网络的可视化解释
人工智能·深度学习·神经网络
Se7en2581 小时前
提升 AI 服务的稳定性:Higress AI 网关的降级功能介绍
人工智能