GPT-Sovits:语音克隆训练-遇坑解决

前言

本来以为3050完全无法执行GPT-Sovits训练的,但经过实践发现其实是可以,并且仅花费了十数分钟便成功训练和推理验证了自己的语音模型。

官方笔记:GPT-SoVITS指南 · 语雀

项目地址:https://github.com/RVC-Boss/GPT-SoVITS

本人借鉴: 丨GPT-SoVITS丨保姆级配置+使用教学

这些笔记比我个人介绍的详细的多,因此这里只给出我遇到的几个问题及解决方案:

1、 pytorch安装问题

2、 RuntimeError: use_libuv was requested but PyTorch was build without libuv...

3、爆显存问题

遇坑解决

pytorch安装问题

见我之前的博客:pytorch-gpu版本安装_搭建pytorch环境(gpu版本)-CSDN博客

RuntimeError: use_libuv was requested but PyTorch was build without libuv...

看起来是说pytorch没有兼容libuv这个模块,因此我尝试去单独装libuv,非常麻烦而且网上信息极少,或许这个路子根本就是错误的。

实际上,更改项目源码或者降级pytorch版本可以解决这一问题

这一点在项目的issues中发掘

重装pytorch会比较烦,所以我更改了项目中的torch模块参数

复制代码
# 更新前
init_method="env://"
# 更新后
init_method="env://?use_libuv=False"

请注意:「init_method="」这部分,有些模块可能带空格,因此你可能需要考虑是否存在「init_method = "」的写法

爆显存问题

区区4G的显存在训练初期就「爆掉」是很正常的,因此你需要避免显存过多占用

因此当你不确定电脑是否可以训练模型时,重启电脑并只运行项目训练是非常有用。

结果

成功使用RTX3050笔记本电脑完成一分钟素材的模型训练(该项目支持一分钟素材的训练工作,并且有一定不错的效果)

素材的质量比时长更重要,必须保证语音素材的清晰情况、以及期望产出的声音特色。

相关推荐
CodeLinghu4 分钟前
提示词链模式:一种利用LLM大语言模型处理复杂任务的强大范式
前端·人工智能·语言模型
Wilber的技术分享7 分钟前
【大模型实战笔记 8】深入理解 LangGraph:构建可持久化、多智能体的 LLM 工作流
人工智能·笔记·agent·langgraph·智能体开发
小二·10 分钟前
AI工程化实战《二》:RAG 高级优化全解——从 HyDE 到 Self-RAG,打造高精度企业问答系统
人工智能·microsoft·机器学习
yuhaiqun198913 分钟前
学AI Agent:从React模式到Plan框架,3条路径一次学透
人工智能·经验分享·笔记·react.js·机器学习·ai·aigc
zhonghua88101621 分钟前
spring ai alibab agent之ReactAgent深度解读
java·人工智能·spring
大模型教程.25 分钟前
收藏级教程:ReAct模式详解,让大模型从回答问题到解决问题
前端·人工智能·机器学习·前端框架·大模型·产品经理·react
飞凌嵌入式25 分钟前
AIoT出海背景下,嵌入式主控的国际认证之路与价值思考
大数据·人工智能·嵌入式硬件·区块链·嵌入式
Robot侠32 分钟前
多模态大语言模型(Multimodal LLM)技术实践指南
人工智能·语言模型·自然语言处理·transformer·rag·多模态大模型
roman_日积跬步-终至千里1 小时前
【计算机视觉概述】:从像素到理解的完整图景
人工智能·计算机视觉
Light601 小时前
【MCP原生时代】第7篇|治理与合规:在模型驱动自动化中把控法律、隐私与伦理风险——把“能做什么”变成可审计、可解释、可追责的企业能力
人工智能·隐私·审计·治理·合规·mcp·伦理