本地部署,强大的音频分离工具,spleeter

目录

[什么是 Spleeter?](#什么是 Spleeter?)

[Spleeter 的主要功能](#Spleeter 的主要功能)

[如何使用 Spleeter?](#如何使用 Spleeter?)

[安装 Spleeter](#安装 Spleeter)

命令行安装

[使用 Spleeter 分离音轨](#使用 Spleeter 分离音轨)

其他分离模式

Docker安装

[Spleeter 的应用场景](#Spleeter 的应用场景)

结论


https://github.com/deezer/spleeterhttps://github.com/deezer/spleeter

在音乐制作和音频处理领域,音频分离是一项技术挑战。想象一下,如果你能从一首完整的歌曲中提取出人声或单独的乐器轨道,这将为音乐创作、混音和音频分析带来无限可能。Spleeter 就是这样一款工具,它利用深度学习技术,实现了高效且高质量的音频分离。

什么是 Spleeter?

Spleeter 是由 Deezer 开发的一个开源音频分离工具。它使用深度学习模型,将混合音轨拆分为单独的组成部分,如人声和伴奏。自发布以来,Spleeter 因其速度和精度而迅速成为音频工程师、音乐家和研究人员的热门工具。

Spleeter 的主要功能

  1. 多轨分离:Spleeter 能够将一首歌曲分离成 2、4 或 5 个独立的轨道。例如,人声、低音、鼓、钢琴以及其他伴奏。
  2. 高效和快速:Spleeter 的设计充分利用了 GPU 加速,能够在数秒内处理一首完整的歌曲。
  3. 开源和易用:Spleeter 是一个开源项目,任何人都可以免费下载和使用。此外,Spleeter 提供了简单的命令行界面,使用户能够轻松上手。

如何使用 Spleeter?

Spleeter 的安装和使用非常简单。以下是一个快速入门指南:

安装 Spleeter

命令行安装

Spleeter 可以通过 pip 安装:

复制代码
pip install spleeter

使用 Spleeter 分离音轨

安装完成后,你可以使用以下命令将音轨分离成两部分:人声和伴奏。

复制代码
spleeter separate -i input_audio.mp3 -p spleeter:2stems -o output/

这条命令会将 input_audio.mp3 分离成两部分,并将结果保存在 output/ 目录中。

其他分离模式

Spleeter 还支持 4 轨和 5 轨分离:

  • 4 轨分离

    复制代码
    spleeter separate -i input_audio.mp3 -p spleeter:4stems -o output/

分离成:人声、鼓、贝斯和其他伴奏。

  • 5 轨分离

    复制代码
    spleeter separate -i input_audio.mp3 -p spleeter:5stems -o output/

分离成:人声、鼓、贝斯、钢琴和其他伴奏。

Docker安装

复制代码
docker run -it -p 7860:7860 --platform=linux/amd64 \
	registry.hf.space/derina-musicspleeter:latest python app.py

界面运行

Spleeter 的应用场景

  1. 音乐制作:音乐制作人可以使用 Spleeter 提取人声或特定乐器轨道进行重新混音或创作。
  2. 音频分析:研究人员可以使用 Spleeter 分析不同组成部分的音频特性,进行音乐信息检索和音频特征提取。
  3. 卡拉 OK 和练习:音乐爱好者可以使用 Spleeter 创建纯伴奏版本的歌曲,用于卡拉 OK 或乐器练习。

结论

Spleeter 是一款强大且易用的音频分离工具,为音乐制作和音频处理提供了前所未有的便利和可能性。无论你是专业的音频工程师还是音乐爱好者,Spleeter 都是一个值得尝试的工具。

如果你对 Spleeter 感兴趣,可以访问其 GitHub 仓库 获取更多信息和资源。享受音频分离带来的乐趣吧!

相关推荐
REDcker3 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo19983 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君3 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥3 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_416276423 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk3 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS3 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_416276423 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_4582838683 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川3 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频