开源的说话人分离项目 | 可以对指定的音频分离不同的说话人 | 通话录音中分离不同的说话人

项目地址

https://github.com/lukeewin/AudioSeparationGUI

运行环境

任意 PC 端

python version >= 3.8

安装

如果使用 GPU 来运行,需要安装好 CUDA

安装 ffmpeg,可以到 ffmpeg 官方地址中下载可执行程序,配置环境变量

按依赖

shell 复制代码
pip install -U funasr modelscop ffmpeg-python

安装 torch,需要根据你电脑情况安装不同的版本,具体可以到 torch 中复制命令安装

运行

shell 复制代码
python app.py

效果

本地可运行的说话人拆分 | 说话人分离

其它

这个程序适合个人 PC 端使用,如果需要服务端接口,支持多路并发,支持大规模集群部署,欢迎联系我。

个人技术博客1:https://lukeewin.top

个人技术博客2:https://blog.lukeewin.top

相关推荐
做怪小疯子7 小时前
华为笔试0429
python·numpy
Warson_L7 小时前
Dictionary
python
寒山李白9 小时前
解决 python-docx 生成的 Word 文档打开时弹出“无法读取内容“警告
python·word·wps·文档·docx·qoder
菩提小狗10 小时前
每日极客日报 · 2026年05月01日
ai·开源·极客日报·it热点·技术资讯
2401_8323655210 小时前
JavaScript中rest参数(...args)取代arguments的优势
jvm·数据库·python
Sirius.z10 小时前
第J3周:DenseNet121算法详解
python
2301_7796224110 小时前
Go语言怎么用信号量控制并发_Go语言semaphore信号量教程【入门】
jvm·数据库·python
2301_7662834410 小时前
c++如何将控制台输出保存到文件_cout重定向到txt【详解】
jvm·数据库·python
冬奇Lab11 小时前
一天一个开源项目(第89篇):Warp - AI 驱动的现代化 Rust 终端
人工智能·rust·开源
小康小小涵12 小时前
基于ESP32S3实现无人机RID模块底层源码编译
linux·开发语言·python