开源的说话人分离项目 | 可以对指定的音频分离不同的说话人 | 通话录音中分离不同的说话人

项目地址

https://github.com/lukeewin/AudioSeparationGUI

运行环境

任意 PC 端

python version >= 3.8

安装

如果使用 GPU 来运行,需要安装好 CUDA

安装 ffmpeg,可以到 ffmpeg 官方地址中下载可执行程序,配置环境变量

按依赖

shell 复制代码
pip install -U funasr modelscop ffmpeg-python

安装 torch,需要根据你电脑情况安装不同的版本,具体可以到 torch 中复制命令安装

运行

shell 复制代码
python app.py

效果

本地可运行的说话人拆分 | 说话人分离

其它

这个程序适合个人 PC 端使用,如果需要服务端接口,支持多路并发,支持大规模集群部署,欢迎联系我。

个人技术博客1:https://lukeewin.top

个人技术博客2:https://blog.lukeewin.top

相关推荐
我的ID配享太庙呀1 小时前
Django 科普介绍:从入门到了解其核心魅力
数据库·后端·python·mysql·django·sqlite
@蓝莓果粒茶2 小时前
LeetCode第350题_两个数组的交集II
c++·python·学习·算法·leetcode·职场和发展·c#
FinAnalyzer2 小时前
如何在 InsCodeAI 上搭建并使用 Jupyter Notebook 环境?
ide·python·jupyter
java1234_小锋2 小时前
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 微博文章数据可视化分析-文章分类下拉框实现
python·自然语言处理·flask
檀越剑指大厂2 小时前
【Python系列】Flask 应用中的主动垃圾回收
开发语言·python·flask
檀越剑指大厂2 小时前
【Python系列】使用 memory_profiler 诊断 Flask 应用内存问题
开发语言·python·flask
WXX_s2 小时前
【OpenCV篇】OpenCV——03day.图像预处理(2)
人工智能·python·opencv·学习·计算机视觉
熊猫钓鱼>_>2 小时前
文心4.5开源之路:从封闭到开放的力量
开源
lovep13 小时前
CLAP文本-音频基础模型: LEARNING AUDIO CONCEPTS FROM NATURAL LANGUAGE SUPERVISION
音视频·语音识别·多模态模型·音频识别·基础模型
Jackilina_Stone4 小时前
【论文|复现】YOLOFuse:面向多模态目标检测的双流融合框架
人工智能·python·目标检测·计算机视觉·融合