ai翻唱入门 - 技术栈

【ai翻唱-稻香】靡烟miya || 月路Yuel

一、数据降噪，去除背景音

1. 工具选择：UVR5（Ultimate Vocal Remover）是当前极为出色的人声伴奏分离工具，开源且免费。

2. 操作步骤：

1. Select input：选定要处理的输入文件。

2. Select output：指定处理后音频文件的输出文件夹。

3. Ensemble options：选择合适的集成选项。

4. Instrumental only：勾选此选项，仅输出原唱文件，去除背景音。

5. Start processing：点击该按钮，开始输出处理。处理完成后，在指定的输出文件夹中可找到处理后的音频文件。

二、数据切分，调整至合适大小

1. 准备工作：将准备好的音频新建一个文件夹。

2. 操作步骤：

三、批量数据重新命名

1. 前期处理：先删除未分割的原文件。

2. 操作步骤：

收起

batch

@echo offSETLOCAL ENABLEDELAYEDEXPANSIONset /A num=0FOR /F "tokens=*" %%i in ('dir /A - D /B /OD /TC') do (

IF NOT "%%i"=="%~n0%~x0" (

set /A num+=1

if!num! LSS 10 (

ren "%%i" "00000!num!%%~xi"

) else if!num! LSS 100 (

ren "%%i" "0000!num!%%~xi"

) else if!num! LSS 1000 (

ren "%%i" "000!num!%%~xi"

) else if!num! LSS 10000 (

ren "%%i" "00!num!%%~xi"

) else (

ren "%%i" "0!num!%%~xi"

)

))ENDLOCALexit

· 新建一个文本文档，将上述代码复制进去，然后更改其后缀名为.bat。

四、数据预处理

1. 工具说明：此程序由他人集成，前端界面为 gradio。

2. 操作步骤：

· 将存放已分割且完成批量处理的文件夹放置在dataset_raw目录下。

· 启动webui.bat，依次点击训练 -> 识别数据集 -> 数据预处理 -> 重新生成配置文件 -> 清空数据信息 -> 写入配置文件 -> 从头开始训练。

五、训练好的数据集使用

1. 操作流程：

· 点击推理，进行模型选择。

· 选择配置文件，然后加载模型。

· 上传音频，并对音频进行转换。具体参数需根据实际情况进行调整。

至此，便掌握了 {AI 翻唱【初级】} 技能。