GPT-SoVITS开源音色克隆框架的训练与调试

GPT-SoVITS开源框架的报错与调试

GPT-SoVITS是一款创新的跨语言音色克隆工具,同时也是一个非常棒的少样本中文声音克隆项目。

它是是一个开源的TTS项目,只需要1分钟的音频文件就可以克隆声音,支持将汉语、英语、日语三种语言的文本转为克隆声音,作者已测试,部署很方便,训练速度很快,效果很好。项目发布不到1个月就有了9.3k star。

遇到的问题

GPT-SoVITS的项目地址为链接: GPT-SoVITS。我在本地部署后,即可打开可视化网页,并在网页上更改参数和进行模型训练。

打开的网页如下所示:

在微调训练中,依次点击开启SoVITS训练和GPT训练后,两个训练进程输出信息为训练已完成。但是在模型的推理页面中,点击刷新路径后,找不到刚刚训练的模型权重。

解决办法

将微调训练中的batch_size改小一点,这里我改为了10,使得程序能够跑起来。

不知为何,显存不足的情况,权重未跑出,但是也没有报错信息。

原因就是查看服务器的显存占用,发现利用率已经快满了。

改过之后,就能够看到模型的权重信息了。

相关推荐
大模型铲屎官4 分钟前
【数据结构与算法-Day 37】超越二分查找:探索插值、斐波那契与分块查找的奥秘
人工智能·python·大模型·二分查找·数据结构与算法·斐波那契·分块查找
数智顾问18 分钟前
Transformer模型:深度解析自然语言处理的革命性架构——从注意力机制到基础架构拆解
人工智能·rnn·深度学习
IT_陈寒19 分钟前
React Hooks 实战:这5个自定义Hook让我开发效率提升了40%
前端·人工智能·后端
KKKlucifer22 分钟前
Gartner 2025 中国网络安全成熟度曲线深度解读:AI 安全如何重构防御逻辑
人工智能·安全·web安全
不摸鱼30 分钟前
CEO回去写代码!AI时代,不懂细节的管理层终将被淘汰 | 不摸鱼的独立开发者日报(第128期)
人工智能·开源·资讯
春末的南方城市43 分钟前
港大和字节携手打造WorldWeaver:以统一建模方案整合感知条件,为长视频生成领域带来质量与一致性双重飞跃。
人工智能·深度学习·机器学习·计算机视觉·aigc·音视频
FreeBuf_1 小时前
微软警示AI驱动的钓鱼攻击:LLM生成的SVG文件绕过邮件安全检测
人工智能·安全·microsoft
攻城狮7号1 小时前
Kimi开源轻量级中间件checkpoint-engine:能20秒内更新万亿参数模型?
人工智能·llm·kimi·moonshotai·checkpoint引擎·开源中间件
居7然1 小时前
JoyAgent-JDGenie深度评测:从开箱到实战,多智能体框架的工业级答卷
分布式·自然语言处理·架构·transformer·agent
夏雨不在低喃1 小时前
YOLOv8目标检测融合RFLA提高小目标准确率
人工智能·yolo·目标检测