GPT-Sovits:语音克隆训练-遇坑解决

前言

本来以为3050完全无法执行GPT-Sovits训练的,但经过实践发现其实是可以,并且仅花费了十数分钟便成功训练和推理验证了自己的语音模型。

官方笔记:GPT-SoVITS指南 · 语雀

项目地址:https://github.com/RVC-Boss/GPT-SoVITS

本人借鉴: 丨GPT-SoVITS丨保姆级配置+使用教学

这些笔记比我个人介绍的详细的多,因此这里只给出我遇到的几个问题及解决方案:

1、 pytorch安装问题

2、 RuntimeError: use_libuv was requested but PyTorch was build without libuv...

3、爆显存问题

遇坑解决

pytorch安装问题

见我之前的博客:pytorch-gpu版本安装_搭建pytorch环境(gpu版本)-CSDN博客

RuntimeError: use_libuv was requested but PyTorch was build without libuv...

看起来是说pytorch没有兼容libuv这个模块,因此我尝试去单独装libuv,非常麻烦而且网上信息极少,或许这个路子根本就是错误的。

实际上,更改项目源码或者降级pytorch版本可以解决这一问题

这一点在项目的issues中发掘

重装pytorch会比较烦,所以我更改了项目中的torch模块参数

复制代码
# 更新前
init_method="env://"
# 更新后
init_method="env://?use_libuv=False"

请注意:「init_method="」这部分,有些模块可能带空格,因此你可能需要考虑是否存在「init_method = "」的写法

爆显存问题

区区4G的显存在训练初期就「爆掉」是很正常的,因此你需要避免显存过多占用

因此当你不确定电脑是否可以训练模型时,重启电脑并只运行项目训练是非常有用。

结果

成功使用RTX3050笔记本电脑完成一分钟素材的模型训练(该项目支持一分钟素材的训练工作,并且有一定不错的效果)

素材的质量比时长更重要,必须保证语音素材的清晰情况、以及期望产出的声音特色。

相关推荐
chaofan980几秒前
GPT-5.5 深度评测:15项基准测试全优,视觉理解精度跃升 42%
大数据·人工智能·gpt·计算机视觉·api
Coovally AI模型快速验证2 分钟前
CVPR 2026|PanDA:首个多模态3D全景分割的无监督域适应框架
人工智能·3d·视觉检测·工业质检
2301_776045234 分钟前
估值和市值的区别(股票与加密资产)
大数据·人工智能
qq_白羊座9 分钟前
提示工程 | 基本概念 | 要素 | 通用技巧
人工智能
写代码写到手抽筋11 分钟前
通信同步原理与5G NR同步实际应用
人工智能·5g·语音识别
胖虎喜欢静香22 分钟前
从零到一快速实现 Mini DeepResearch
人工智能·python·开源
MoonBit月兔24 分钟前
「Why MoonBit 」第一期——Singularity Note AI 学习助手
开发语言·人工智能·moonbit
β添砖java30 分钟前
深度学习(11)数值稳定+模型初始化、激活函数
人工智能·深度学习
珠海西格电力38 分钟前
零碳园区产业园管理系统的全场景源网荷储氢协同调度功能是如何实现的
大数据·运维·人工智能·物联网·能源
smallyoung39 分钟前
具有反思能力的 Agentic RAG 实战:用 LangChain4j 实现 CRAG 纠错检索
人工智能·后端