GPT-SoVITS音色克隆-模型训练步骤

GPT-SoVITS音色克隆-模型训练步骤

启动模型训练的主页面

1. 切到模型路径

复制代码
/psycheEpic/GPT-SoVITS
  • 进入Python虚拟环境,并挂起执行python脚本

    conda activate GPTSoVits
    nohup python ./webui.py >>./webui.log &

  • 查看日志 tail -500f webui.log

2. uvr5人声分离和去混响处理

  • 切换到路径

    cd /psycheEpic/GPT-SoVITS/tools/uvr5

  • 启动uvr5操作web界面

  • python webui.py "cuda" True 15666 True

3. 人声分离操作

在浏览器进入界面:https://73de21d131614dd42e.gradio.live,这个地址每次启动都会变得

先用HP2模型处理一遍(提取人声),然后将输出的干声音频再用onnx_dereverb最后用DeEcho-Aggressive(去混响),输出格式选wav。输出的文件默认在GPT-SoVITS-beta\GPT-SoVITS-beta\output\uvr5_opt这个文件夹下,建议不要改输出路径,到时候找不到文件谁也帮不了你。处理完的音频(vocal)的是人声,(instrument)是伴奏,(No Reverb)的没混响的,(Reverb)的是混响。(vocal)(No Reverb)才是要用的文件,其他都可以删除。结束后记得到WebUI关闭UVR5节省显存。

1)第一步先提前人声,人声和背景音乐分离,HP2模型

2)第二步将上一步分离出来的人声,上传作为输入,再使用onnx_dereverb提前一次人声

3)第三步将上一步的人声作为输入,去混响,使用DeEcho-Aggressive(去混响)

4. 将长音频进行切割

进入主页面操作:

5.给切割好的音频作为输入,给对路径,调用模型进行打标

为什么要打标:打标就是给每个音频配上文字,这样才能让AI学习到每个字该怎么读。这里的标指的是标注

这步很简单只要把刚才的切分文件夹输入,如果你音频降噪过,那么默认是output/slicer_opt文件夹,如果你切分了没有降噪,那么默认是output/slicer_opt文件夹。然后选择达摩ASR或者fast whisper。达摩ASR只能用于识别中文,效果也最好。fast whisper可以标注99种语言,是目前最好的英语和日语识别,模型尺寸选large V3,语种选auto自动就好了。然后点开启离线批量ASR就好了,默认输出是output/asr_opt这个路径,建议不要改输出路径,到时候找不到文件谁也帮不了你。ASR需要一些时间,看着控制台有没有报错就好了。

6. 标注校验

7.GPT-SoVITS-TTS-训练集格式化工具-填好参数一键三连

8. 微调训练

9. 模型推理,刷新模型

  • 执行脚本,打开推理页面

    进入Python环境
    conda activate GPTSoVits
    cd /psycheEpic/GPT-SoVITS/GPT_SoVITS/
    nohup python inference_webui.py >>./inference_webui.log &

相关推荐
AI智图坊10 分钟前
AIGC赋能跨境电商:如何利用「图生图」与模型提取,破解POD节日款“卡图案”技术瓶颈?
大数据·人工智能·gpt·ai作画·aigc
极连AI8 小时前
国产大模型譬如DeepSeek接入codex教程分享
人工智能·gpt·chatgpt·api·token·极连ai·zovelox.com
向量引擎21 小时前
多模型 API 网关接入实践:统一 Base URL、API Key 管理与故障排查
人工智能·gpt·ai编程·ai写作·key
searchforAI1 天前
2026年AI笔记工具对比实测:NotebookLM、通义听悟、Ai好记怎么选?
人工智能·笔记·gpt·ai·whisper·音视频·语音识别
财迅通Ai1 天前
MiniMax发布新一代大模型M3 编程能力评测超越GPT-5.5
gpt·minimax
searchforAI1 天前
长视频和播客怎么变成结构化读书笔记?一套 AI 时代的知识管理方法
人工智能·笔记·gpt·音视频·语音识别
Nayxxu1 天前
GPT API 迁移教程:Chat Completions 到 Responses API 的最小改造路径
数据库·gpt
AI智图坊1 天前
电商详情页转化率提升实战:基于AI的“卖点-视觉”转化链路设计与自动化实现
大数据·运维·人工智能·gpt·ai作画·自动化·aigc
AI设计小站1 天前
GPT Image2国内可用方案实测:创客贴AI生成+分层编辑能力解析
人工智能·gpt·php
happyprince1 天前
18-Hugging Face Transformers之GPT-2 案例详解:Decoder-only 自回归模型的完整生命周期
gpt·数据挖掘·回归