如何使用GPT-SoVITSS生成各种角色的语言

百度网盘 请输入提取码

项目来自b站UP主花儿不哭

一,先除去背景声音------------人生伴奏出去背景声音

1.下载后,按下面路径打开,打开文件beta,打开go-webui程序

回车,然后稍等一下,等待网页打开

2.勾选如下,稍等一下,又会打开新界面

3.将需要去除背景音乐的文件拖入以下位置

我这是拖入后的

转换后

4.回到文件夹,按以下路径打开

这个就是除掉人声的音乐文件了,打开听听,下面一个是除掉背景音乐的文件

最后,我们把想要的音频,放到我们想要存放的文件夹,记住位置

二,音频数据处理------

1.回到开始的界面,取选我们之前人声分离是否开启UVR5-WebUI这个

2.输入根目录

复制粘贴,我们处理后的音频路径及音频本身命名

2.输出根目录

按以下图片序号顺序来

找到我们的含上面输出路径的输出目录

4.得到以下路径,顺便复制

5.粘贴如下

粘贴到输入文件夹路径即可,序号2,可以直接用达摩,这个比较快

6.asr_

找到该文件夹,打开后,可以发现是后缀为.list的文件

7.我的是记事本打开,打开后就没有.list后缀了,但我们后面需要后缀,你可以在属性里看后缀

转记事本,可以看到对应的文本

8.接着,如下

9.粘贴至如下,勾选开启打标WebUI,然后稍等一下,会打开新的界面

10.如下新界面,我们可以翻译一下

11.把yes勾选上,点击合成音频,可以拼在一起

12.点击保存文件

13.然后关闭界面

回到一开始界面,取选打标

三,训练模型

1.滑到上面,点击这个

2,再此使用以下位置的路径,复制

3.按如下操作,随你取名,并粘贴路径

4.找到我们这里的路径,复制

5.粘贴到如下

6.直接一键三连,其他的你也可以随便操作一下,等待执行结束

7.回到开始的目录,找到logs文件点击

8.得到如下文件

9,一键三连结束后,选择微调训练

10.保持默认即可

按顺序点击,下面两个训练,可以在终端cmd里看进度,等待训练完成

检测找到这两个训练完成的模型,点开检测一下文件

四,生成想要的语音

1.打开推理,勾选如下,然后等待打开新界面

2.刷新模型路径

GPT模型列表,找到自己命名的模型,选择数值最大的

SoVITS模型列表,找到自己命名的模型,选择数值最大的

3.上传之前对应切割好的音频

找到其文件夹位置,拖入如下

4.输入这个语言里对应的文本

我们先到这个路径用记事本打开,复制一下文本

粘贴到如下,语种中文

5.输入你想要的语音文本,合成,播放,尝试一下

6.下载即可

完成,感谢观看

相关推荐
人工智能训练2 分钟前
从 1.1.3 到 1.13.2!Ubuntu 24.04 上 Dify 升级保姆级教程(零数据丢失 + 一键迁移)
linux·运维·人工智能·windows·ubuntu·dify
醉舞经阁半卷书12 分钟前
从零到1了解Agent Skills
人工智能·机器学习
冰西瓜6003 分钟前
深度学习的数学原理(二十二)—— Seq2Seq编码器-解码器基础框架
人工智能·深度学习
袖手蹲4 分钟前
Arduino UNO Q 板载 Nanobot 自动化编程指南之七
运维·人工智能·自动化
AI医影跨模态组学5 分钟前
J Immunother Cancer(IF=10.6)中山大学孙逸仙纪念医院陈柏深等团队:动态时间数据预测NSCLC新辅助免疫化疗主要病理反应
人工智能·深度学习·机器学习·医学·医学影像
tzy2335 分钟前
Skill 为什么“淘汰”了 MCP?
ai·agent·function call·skill·mcp
智者知已应修善业7 分钟前
【文氏电桥振荡电路】2022-8-25
驱动开发·经验分享·笔记·硬件架构·硬件工程
liliwoliliwo10 分钟前
vision transformer
人工智能·深度学习·transformer
tkevinjd18 分钟前
hello-agents-chapter1-初识智能体
人工智能·ai·agent
li三河19 分钟前
opencv利用freetype写中文
人工智能·opencv·计算机视觉