声纹识别

夜雨飘零110 小时前
人工智能·pytorch·python·声纹识别·说话人分离·说话人日志
基于Pytorch实现的说话人日志(说话人分离)VoiceprintRecognition_Pytorch 是博主开源的一款声纹识别框架,该框架支持EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法,支持AAMLoss、AMLoss、ARMLoss、CELoss等多种损失函数。该框架支持多种关于声纹识别的处理,比如声纹对,比声纹检索,以及本文章需要介绍的说话人日志(说话人分离)。
Eric.Lee20213 个月前
人工智能·python·深度学习·音视频·语音识别·声纹识别
语音音频(wav)声纹识别-技术实现-python通过pyannote.audio 实现语音音频声纹识别。安装:示例音频下载地址:【免费】语音音频(WAV)声纹识别示例资源-CSDN文库
顶呱呱程序6 个月前
matlab·声纹识别·mfcc特征
2-7 基于matlab实现声纹识别基于matlab实现声纹识别,通过提取声音信号的MFCC特征,然后形成特征向量,通过训练语音,对测试语音进行识别,可以识别训练库内的声音,也可以识别出训练库外的声音。程序已调通,可直接运行。
夜雨飘零11 年前
人工智能·深度学习·paddlepaddle·声纹识别
基于PaddlePaddle实现的声纹识别系统本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,不排除以后会支持更多模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法,使用了ArcFace Loss,ArcFace loss:Additive Angular Margin Loss(加性角度间隔损失函数),对应项目中的AAMLoss,对特征向量和权重归一化,对θ加上角度间隔m,角度间隔比余弦间隔在对角度的影响更加直接,除此之外,还
夜雨飘零11 年前
人工智能·pytorch·python·深度学习·声纹识别
基于Pytorch实现的声纹识别系统本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,不排除以后会支持更多模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法,使用了ArcFace Loss,ArcFace loss:Additive Angular Margin Loss(加性角度间隔损失函数),对应项目中的AAMLoss,对特征向量和权重归一化,对θ加上角度间隔m,角度间隔比余弦间隔在对角度的影响更加直接,除此之外,还