GPT-Sovits:语音克隆训练-遇坑解决

前言

本来以为3050完全无法执行GPT-Sovits训练的,但经过实践发现其实是可以,并且仅花费了十数分钟便成功训练和推理验证了自己的语音模型。

官方笔记:GPT-SoVITS指南 · 语雀

项目地址:https://github.com/RVC-Boss/GPT-SoVITS

本人借鉴: 丨GPT-SoVITS丨保姆级配置+使用教学

这些笔记比我个人介绍的详细的多,因此这里只给出我遇到的几个问题及解决方案:

1、 pytorch安装问题

2、 RuntimeError: use_libuv was requested but PyTorch was build without libuv...

3、爆显存问题

遇坑解决

pytorch安装问题

见我之前的博客:pytorch-gpu版本安装_搭建pytorch环境(gpu版本)-CSDN博客

RuntimeError: use_libuv was requested but PyTorch was build without libuv...

看起来是说pytorch没有兼容libuv这个模块,因此我尝试去单独装libuv,非常麻烦而且网上信息极少,或许这个路子根本就是错误的。

实际上,更改项目源码或者降级pytorch版本可以解决这一问题

这一点在项目的issues中发掘

重装pytorch会比较烦,所以我更改了项目中的torch模块参数

复制代码
# 更新前
init_method="env://"
# 更新后
init_method="env://?use_libuv=False"

请注意:「init_method="」这部分,有些模块可能带空格,因此你可能需要考虑是否存在「init_method = "」的写法

爆显存问题

区区4G的显存在训练初期就「爆掉」是很正常的,因此你需要避免显存过多占用

因此当你不确定电脑是否可以训练模型时,重启电脑并只运行项目训练是非常有用。

结果

成功使用RTX3050笔记本电脑完成一分钟素材的模型训练(该项目支持一分钟素材的训练工作,并且有一定不错的效果)

素材的质量比时长更重要,必须保证语音素材的清晰情况、以及期望产出的声音特色。

相关推荐
Agent手记17 小时前
安全生产巡检全流程自动化与隐患预警方案:2026工业Agent落地实战指南
数据库·人工智能·安全·ai·自动化
SEO_juper17 小时前
语音搜索 GEO 优化,口语化英文短句布局玩法
人工智能·seo·geo·谷歌优化·2026·谷歌算法更新·口语化
szxinmai主板定制专家17 小时前
RK3568 + CODESYS+实时系统运动控制器PLC,支持 AI 视觉目标检测,预测性维护,混合多系统部署,多路模拟量采集
arm开发·人工智能·嵌入式硬件·fpga开发
大囚长17 小时前
自由能原理与预测处理的理论解析及其跨领域启示
人工智能·数学建模
Want59517 小时前
数字人场景落地:企业展厅 / 指挥大屏从展示到服务
人工智能·数字人
倔强的石头10617 小时前
两种数字人交互:从被动语音交互到具象共情的本质差异
microsoft·交互·语音识别
工业机器人销售服务17 小时前
伯朗特机器人集成智能料库,为多台激光切割机提供24小时不间断的板材上下料服务
人工智能
前端若水17 小时前
从零开始学习AI Agent的实战路线图
人工智能·学习
ting945200017 小时前
Vivago Video Agent 技术深度解析:大模型驱动的叙事视频全链路生成
人工智能·音视频
鸽芷咕17 小时前
MuMu模拟器接入AI工具,三步实现自然语言控制
人工智能