技术栈

说话人分离

夜雨飘零1
6 个月前
人工智能·pytorch·python·声纹识别·说话人分离·说话人日志
基于Pytorch实现的说话人日志(说话人分离)VoiceprintRecognition_Pytorch 是博主开源的一款声纹识别框架,该框架支持EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法,支持AAMLoss、AMLoss、ARMLoss、CELoss等多种损失函数。该框架支持多种关于声纹识别的处理,比如声纹对,比声纹检索,以及本文章需要介绍的说话人日志(说话人分离)。
Luke Ewin
7 个月前
python·开源·音视频·语音识别·说话人分离·说话人归类
开源的说话人分离项目 | 可以对指定的音频分离不同的说话人 | 通话录音中分离不同的说话人https://github.com/lukeewin/AudioSeparationGUI任意 PC 端 python version >= 3.8