ai翻唱入门

【ai翻唱-稻香】靡烟miya || 月路Yuel

一、数据降噪,去除背景音

1. 工具选择:UVR5(Ultimate Vocal Remover)是当前极为出色的人声伴奏分离工具,开源且免费。

2. 操作步骤

1. Select input:选定要处理的输入文件。

2. Select output:指定处理后音频文件的输出文件夹。

3. Ensemble options:选择合适的集成选项。

4. Instrumental only:勾选此选项,仅输出原唱文件,去除背景音。

5. Start processing:点击该按钮,开始输出处理。处理完成后,在指定的输出文件夹中可找到处理后的音频文件。

二、数据切分,调整至合适大小

1. 准备工作:将准备好的音频新建一个文件夹。

2. 操作步骤

  1. 打开音频切片软件slicer - gui(audio - slicer)。

  2. 把音频文件拖入软件。

  3. 将minimun interval(最小间隔)参数调整为 100。

  4. 将maximun silence langth(ms)【最大沉默时长(ms)】参数调整为 300。

  5. 完成设置后,点击输出即可。

三、批量数据重新命名

1. 前期处理:先删除未分割的原文件。

2. 操作步骤

  1. 使用 bat 文件对分割好的数据进行重新命名,bat 代码如下:

收起

batch

@echo offSETLOCAL ENABLEDELAYEDEXPANSIONset /A num=0FOR /F "tokens=*" %%i in ('dir /A - D /B /OD /TC') do (

IF NOT "%%i"=="%~n0%~x0" (

set /A num+=1

if!num! LSS 10 (

ren "%%i" "00000!num!%%~xi"

) else if!num! LSS 100 (

ren "%%i" "0000!num!%%~xi"

) else if!num! LSS 1000 (

ren "%%i" "000!num!%%~xi"

) else if!num! LSS 10000 (

ren "%%i" "00!num!%%~xi"

) else (

ren "%%i" "0!num!%%~xi"

)

))ENDLOCALexit

· 新建一个文本文档,将上述代码复制进去,然后更改其后缀名为.bat。

四、数据预处理

1. 工具说明:此程序由他人集成,前端界面为 gradio。

2. 操作步骤

· 将存放已分割且完成批量处理的文件夹放置在dataset_raw目录下。

· 启动webui.bat,依次点击训练 -> 识别数据集 -> 数据预处理 -> 重新生成配置文件 -> 清空数据信息 -> 写入配置文件 -> 从头开始训练。

五、训练好的数据集使用

1. 操作流程

· 点击推理,进行模型选择。

· 选择配置文件,然后加载模型。

· 上传音频,并对音频进行转换。具体参数需根据实际情况进行调整。

至此,便掌握了 {AI 翻唱【初级】} 技能。

相关推荐
mwq3012310 分钟前
如何写出好用的提示词?——从原理到实操,以“减肥食谱”为例全解析
人工智能
88号技师12 分钟前
2025年一区SCI-回旋镖气动椭圆优化算法Boomerang Aerodynamic Ellipse-附Matlab免费代码
开发语言·人工智能·算法·matlab·优化算法
胖哥真不错15 分钟前
基于MATLAB的极限学习机ELM的数据回归预测方法应用
人工智能·matlab·数据挖掘·回归·项目实战·数据回归预测·极限学习机elm
亚马逊云开发者16 分钟前
从分析到优化:Amazon Q CLI 助力 EKS 网络调用链剖析与运维实践
人工智能
AI扶我青云志38 分钟前
“hidden act“:“gelu“在bert中作用
人工智能·深度学习·bert
聚客AI1 小时前
🤖Cherry Studio+ MCP实现文件自由操控的奥秘
人工智能·llm·mcp
Hao想睡觉1 小时前
全连接神经网络之参数初始化和损失函数(四)
人工智能·深度学习·神经网络
dev2 小时前
用xiaozhi-server搭建一个私有小智后台
前端·人工智能·嵌入式
北京地铁1号线2 小时前
旋转目标检测(Rotated Object Detection)技术概述
人工智能·目标检测·计算机视觉
伊织code3 小时前
OpenCV 官翻 1 -介绍、安装、功能概览、核心操作
人工智能·opencv·计算机视觉·图像·直线·曲线·功能