GPT-SoVITS开源音色克隆框架的训练与调试

GPT-SoVITS开源框架的报错与调试

GPT-SoVITS是一款创新的跨语言音色克隆工具,同时也是一个非常棒的少样本中文声音克隆项目。

它是是一个开源的TTS项目,只需要1分钟的音频文件就可以克隆声音,支持将汉语、英语、日语三种语言的文本转为克隆声音,作者已测试,部署很方便,训练速度很快,效果很好。项目发布不到1个月就有了9.3k star。

遇到的问题

GPT-SoVITS的项目地址为链接: GPT-SoVITS。我在本地部署后,即可打开可视化网页,并在网页上更改参数和进行模型训练。

打开的网页如下所示:

在微调训练中,依次点击开启SoVITS训练和GPT训练后,两个训练进程输出信息为训练已完成。但是在模型的推理页面中,点击刷新路径后,找不到刚刚训练的模型权重。

解决办法

将微调训练中的batch_size改小一点,这里我改为了10,使得程序能够跑起来。

不知为何,显存不足的情况,权重未跑出,但是也没有报错信息。

原因就是查看服务器的显存占用,发现利用率已经快满了。

改过之后,就能够看到模型的权重信息了。

相关推荐
一切尽在,你来17 分钟前
1.2 LangChain 1.2.7 版本核心特性与升级点
人工智能·langchain
LYFlied19 分钟前
AI大时代下前端跨端解决方案的现状与演进路径
前端·人工智能
深蓝电商API21 分钟前
图片验证码识别:pytesseract+opencv入门
人工智能·opencv·计算机视觉·pytesseract
.Katherine௰22 分钟前
AI数字人模拟面试机器人
人工智能
光影少年23 分钟前
AI 前端 / 高级前端
前端·人工智能·状态模式
zhangshuang-peta27 分钟前
OpenCode vs Claude Code vs OpenAI Codex:AI编程助手全面对比
人工智能·ai agent·mcp·peta
Bruk.Liu30 分钟前
(LangChain 实战14):基于 ChatMessageHistory 自定义实现对话记忆功能
人工智能·python·langchain·agent
代码改善世界31 分钟前
CANN中的AI算子开发:ops-nn仓库深度解读
人工智能
l1t43 分钟前
DeepSeek总结的PostgreSQL的GPT推理SQL移植到DuckDB的性能优化方法
sql·gpt·postgresql
大江东去浪淘尽千古风流人物1 小时前
【VLN】VLN(Vision-and-Language Navigation视觉语言导航)算法本质,范式难点及解决方向(1)
人工智能·python·算法