开源的说话人分离项目 | 可以对指定的音频分离不同的说话人 | 通话录音中分离不同的说话人

项目地址

https://github.com/lukeewin/AudioSeparationGUI

运行环境

任意 PC 端

python version >= 3.8

安装

如果使用 GPU 来运行,需要安装好 CUDA

安装 ffmpeg,可以到 ffmpeg 官方地址中下载可执行程序,配置环境变量

按依赖

shell 复制代码
pip install -U funasr modelscop ffmpeg-python

安装 torch,需要根据你电脑情况安装不同的版本,具体可以到 torch 中复制命令安装

运行

shell 复制代码
python app.py

效果

本地可运行的说话人拆分 | 说话人分离

其它

这个程序适合个人 PC 端使用,如果需要服务端接口,支持多路并发,支持大规模集群部署,欢迎联系我。

个人技术博客1:https://lukeewin.top

个人技术博客2:https://blog.lukeewin.top

相关推荐
mo47761 小时前
Webrtc音频模块(四) 音频采集
音视频·webrtc
icy、泡芙1 小时前
T527-----音频调试
linux·驱动开发·音视频
易我数据恢复大师1 小时前
怎么提取音频保存到本地?电脑音频提取方法
音视频·软件·音频提取
野蛮的大西瓜1 小时前
开源呼叫中心中,如何将ASR与IVR菜单结合,实现动态的IVR交互
人工智能·机器人·自动化·音视频·信息与通信
在肯德基吃麻辣烫1 小时前
使用开源在线聊天工具Fiora轻松搭建个性化聊天平台在线交流
开源
是小崔啊2 小时前
开源轮子 - EasyExcel01(核心api)
java·开发语言·开源·excel·阿里巴巴
黄公子学安全2 小时前
Java的基础概念(一)
java·开发语言·python
程序员一诺2 小时前
【Python使用】嘿马python高级进阶全体系教程第10篇:静态Web服务器-返回固定页面数据,1. 开发自己的静态Web服务器【附代码文档】
后端·python
小木_.3 小时前
【Python 图片下载器】一款专门为爬虫制作的图片下载器,多线程下载,速度快,支持续传/图片缩放/图片压缩/图片转换
爬虫·python·学习·分享·批量下载·图片下载器
Jiude3 小时前
算法题题解记录——双变量问题的 “枚举右,维护左”
python·算法·面试