GPT-SoVITS开源音色克隆框架的训练与调试

GPT-SoVITS开源框架的报错与调试

GPT-SoVITS是一款创新的跨语言音色克隆工具,同时也是一个非常棒的少样本中文声音克隆项目。

它是是一个开源的TTS项目,只需要1分钟的音频文件就可以克隆声音,支持将汉语、英语、日语三种语言的文本转为克隆声音,作者已测试,部署很方便,训练速度很快,效果很好。项目发布不到1个月就有了9.3k star。

遇到的问题

GPT-SoVITS的项目地址为链接: GPT-SoVITS。我在本地部署后,即可打开可视化网页,并在网页上更改参数和进行模型训练。

打开的网页如下所示:

在微调训练中,依次点击开启SoVITS训练和GPT训练后,两个训练进程输出信息为训练已完成。但是在模型的推理页面中,点击刷新路径后,找不到刚刚训练的模型权重。

解决办法

将微调训练中的batch_size改小一点,这里我改为了10,使得程序能够跑起来。

不知为何,显存不足的情况,权重未跑出,但是也没有报错信息。

原因就是查看服务器的显存占用,发现利用率已经快满了。

改过之后,就能够看到模型的权重信息了。

相关推荐
南湖北漠几秒前
避免电子设备的电磁波干扰和电磁波互相干扰对我们生活的危害
网络·人工智能·计算机网络·其他·安全·生活
ZStack开发者社区几秒前
从 “制造” 到 “智造”,ZStack助力制造企业破局而上
人工智能·云计算·制造
王莎莎-MinerU4 分钟前
MinerU 生态全接入:LangChain、Dify、RAGFlow、LlamaIndex 六大框架完整集成指南(2026)
计算机视觉·chatgpt·langchain·pdf·github·aigc
科技峰行者6 分钟前
解析OpenClaw安全挑战及应对策略 构筑AI Agent安全新边界
网络·人工智能·科技·安全·aws·亚马逊·亚马逊云科技
MediaTea12 分钟前
Scikit-learn:一个最小机器学习工作流示例
人工智能·python·机器学习·scikit-learn
EnCi Zheng14 分钟前
01b-上下文向量与信息瓶颈
人工智能
张忠琳14 分钟前
【vllm】(五)vLLM v1 Attention — 模块超深度分析之二
人工智能·深度学习·ai·架构·vllm
Yuer202519 分钟前
幻觉量化(Hallucination Quantization):从随机语言模型到确定性交付系统的工程范式
大数据·人工智能·语言模型
九章智算云24 分钟前
一份CLAUDE.md,为何能让GitHub榜首项目狂揽6万星?
人工智能·ai·大模型·agent·ai工具·claude code·vibe-coding
Yunzenn30 分钟前
# 零基础复现Claude Code(二):地基篇——让模型开口说话
人工智能·架构