开源的说话人分离项目 | 可以对指定的音频分离不同的说话人 | 通话录音中分离不同的说话人

Luke Ewin2024-11-17 12:12

项目地址

https://github.com/lukeewin/AudioSeparationGUI

运行环境

任意 PC 端

python version >= 3.8

安装

如果使用 GPU 来运行，需要安装好 CUDA

安装 ffmpeg，可以到 ffmpeg 官方地址中下载可执行程序，配置环境变量

按依赖

shell 复制代码

pip install -U funasr modelscop ffmpeg-python

安装 torch，需要根据你电脑情况安装不同的版本，具体可以到 torch 中复制命令安装

运行

shell 复制代码

python app.py

效果

本地可运行的说话人拆分 | 说话人分离

其它

这个程序适合个人 PC 端使用，如果需要服务端接口，支持多路并发，支持大规模集群部署，欢迎联系我。

个人技术博客1：https://lukeewin.top

个人技术博客2：https://blog.lukeewin.top

上一篇：【MySQL】ubantu 系统 MySQL的安装与免密码登录的配置

下一篇：快速搭建Android开发环境：Docker部署docker-android并实现远程连接

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04AI科技热点日报 | 2026年07月01日 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 102026 年 AI 大模型 & AI 编程工具实战全总结