使用GPT-SoVITS训练语音模型

1.项目演示

阅读单句话

1725352713141

读古诗

1725353700203


2.项目环境

开发环境:linux

机器配置如下:实际使用率百分之二十几,

3.开发步骤

1.首先是准备数据集,要求是wav格式,一到两个小时即可,

2.配置GPT-SoVITS需要的环境,

这里要注意,如果是windows直接下载整合包,linux用户则需要先把项目克隆到本地,然后再将模型下载下来放进去,才能继续成功运行。

整合包及模型下载链接 (yuque.com)

Linux的步骤在下面,

2.1 克隆项目

进入项目地址,点击code,再点击复制按钮将链接复制下来。

之后到自己的服务器里去,执行即可,(ps:可以先创建一个文件夹,git初始化这些老生常谈的事情,再放进去。不过我们的主要目的是用而不是修改。)

复制代码
git clone https://github.com/RVC-Boss/GPT-SoVITS.git

github项目链接如下:

RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning) (github.com)

2.2 安装运行所需的库

进入服务器,创建虚拟环境

2.3 将下载好的模型放入对应的位置

3.进行数据的初步处理

4.进行所需模型数据的提取

5.开始训练模型

6.训练完成!开始推理。

相关推荐
zy_destiny6 分钟前
【工业场景】用YOLOv12实现饮料类别识别
人工智能·python·深度学习·yolo·机器学习·计算机视觉·目标跟踪
姚瑞南8 分钟前
从模糊感知到量化评估:构建一个Prompt打分工具
人工智能·自然语言处理·chatgpt·prompt·aigc
机器之心13 分钟前
ICLR 2025 Spotlight | 参数高效微调新范式!上海交大联合上海AI Lab推出参数冗余微调算法
人工智能
机器之心23 分钟前
OpenAI的AI复现论文新基准,Claude拿了第一名
人工智能
骑猪兜风23329 分钟前
没有人知道“他妈的” 智能体到底是什么
人工智能·openai·ai编程
www_pp_30 分钟前
# 实时人脸识别系统:基于 OpenCV 和 Python 的实现
人工智能·python·opencv
果冻人工智能31 分钟前
MCP:让 AI 应用更聪明,只需几分钟
人工智能
人工智能培训咨询叶梓44 分钟前
LLAMAFACTORY:一键优化大型语言模型微调的利器
人工智能·语言模型·自然语言处理·性能优化·调优·大模型微调·llama factory
果冻人工智能1 小时前
数学不是你以为的那样 —— 但它决定你在AI时代的命运
人工智能
蓝衣剑客1 小时前
山姆·奥特曼传(二):OpenAI的第一次内斗
人工智能·ai编程