使用GPT-SoVITS训练语音模型

1.项目演示

阅读单句话

1725352713141

读古诗

1725353700203


2.项目环境

开发环境:linux

机器配置如下:实际使用率百分之二十几,

3.开发步骤

1.首先是准备数据集,要求是wav格式,一到两个小时即可,

2.配置GPT-SoVITS需要的环境,

这里要注意,如果是windows直接下载整合包,linux用户则需要先把项目克隆到本地,然后再将模型下载下来放进去,才能继续成功运行。

整合包及模型下载链接 (yuque.com)

Linux的步骤在下面,

2.1 克隆项目

进入项目地址,点击code,再点击复制按钮将链接复制下来。

之后到自己的服务器里去,执行即可,(ps:可以先创建一个文件夹,git初始化这些老生常谈的事情,再放进去。不过我们的主要目的是用而不是修改。)

复制代码
git clone https://github.com/RVC-Boss/GPT-SoVITS.git

github项目链接如下:

RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning) (github.com)

2.2 安装运行所需的库

进入服务器,创建虚拟环境

2.3 将下载好的模型放入对应的位置

3.进行数据的初步处理

4.进行所需模型数据的提取

5.开始训练模型

6.训练完成!开始推理。

相关推荐
牛奶几秒前
AI辅助开发的基础概念
前端·人工智能·ai编程
东坡肘子1 分钟前
OpenClaw 不错,但我好像没有那么需要 -- 肘子的 Swift 周报 #125
人工智能·swiftui·swift
风象南8 小时前
普通人用AI加持赚到的第一个100块
人工智能·后端
牛奶8 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶8 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
罗西的思考11 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab12 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab12 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸13 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云13 小时前
可观测性 4.0:教系统如何思考
人工智能