【20min 急速入门】使用Demucs进行音轨分离

  1. 创建环境
sh 复制代码
conda create --name mujica python=3.10
  1. 下载加速依赖

先用nvidia-smi检查机器使用的独显版本, 然后从pytorch官网下载对应的GPU版torch, torchaudio

比如我的是12.2, 就下载11.8版本的

sh 复制代码
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
  1. 下载音频处理依赖
sh 复制代码
conda install -c conda-forge ffmpeg

FFmpeg 是一个开源的音视频处理工具库,可以用于​​解码、编码、转码、混流、分离、流媒体处理​​等操作,如果要处理mp3等格式,必须先下载。

  1. 安装demucs
sh 复制代码
pip install demucs
  1. 使用
sh 复制代码
demucs --mp3 <filename>

之后就会在当前文件夹下生成一个seperate文件夹, 里面有分离的四音轨数据

sh 复制代码
.
├── fog.mp3
└── separated
    └── htdemucs
        └── fog
            ├── bass.mp3
            ├── drums.mp3
            ├── other.mp3
            └── vocals.mp3