声纹识别

Luke Ewin1 个月前
人工智能·语音识别·声纹识别·通话录音区分说话人
基于3D-Speaker进行区分说话人项目搭建过程报错记录 | 通话录音说话人区分以及语音识别 | 声纹识别以及语音识别 | pyannote-audio在外呼系统中,我们的后台管理系统通常要对电话录音的内容进行提取和分析。那么说到分析,我们就要对录音中的两个人的对话进行分离,然后分别分析,比如分析客户是否有合作的意愿,分析客服讲的话术是否合理,分析客户情绪等等。那么这里就需要首先做说话人的分离。目前市面上有众多的说话人分离开源项目,其它国内比较知名的是阿里巴巴旗下的3D-Speaker。
夜雨飘零11 个月前
人工智能·pytorch·python·声纹识别·说话人分离·说话人日志
基于Pytorch实现的说话人日志(说话人分离)VoiceprintRecognition_Pytorch 是博主开源的一款声纹识别框架,该框架支持EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法,支持AAMLoss、AMLoss、ARMLoss、CELoss等多种损失函数。该框架支持多种关于声纹识别的处理,比如声纹对,比声纹检索,以及本文章需要介绍的说话人日志(说话人分离)。
Eric.Lee20214 个月前
人工智能·python·深度学习·音视频·语音识别·声纹识别
语音音频(wav)声纹识别-技术实现-python通过pyannote.audio 实现语音音频声纹识别。安装:示例音频下载地址:【免费】语音音频(WAV)声纹识别示例资源-CSDN文库
顶呱呱程序7 个月前
matlab·声纹识别·mfcc特征
2-7 基于matlab实现声纹识别基于matlab实现声纹识别,通过提取声音信号的MFCC特征,然后形成特征向量,通过训练语音,对测试语音进行识别,可以识别训练库内的声音,也可以识别出训练库外的声音。程序已调通,可直接运行。
夜雨飘零11 年前
人工智能·深度学习·paddlepaddle·声纹识别
基于PaddlePaddle实现的声纹识别系统本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,不排除以后会支持更多模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法,使用了ArcFace Loss,ArcFace loss:Additive Angular Margin Loss(加性角度间隔损失函数),对应项目中的AAMLoss,对特征向量和权重归一化,对θ加上角度间隔m,角度间隔比余弦间隔在对角度的影响更加直接,除此之外,还
夜雨飘零11 年前
人工智能·pytorch·python·深度学习·声纹识别
基于Pytorch实现的声纹识别系统本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,不排除以后会支持更多模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法,使用了ArcFace Loss,ArcFace loss:Additive Angular Margin Loss(加性角度间隔损失函数),对应项目中的AAMLoss,对特征向量和权重归一化,对θ加上角度间隔m,角度间隔比余弦间隔在对角度的影响更加直接,除此之外,还