技术栈
3d-speaker
Luke Ewin
13 小时前
人工智能
·
python
·
音视频
·
语音识别
·
声纹识别
·
asr
·
3d-speaker
根据音频中的不同讲述人声音进行分离音频 | 基于ai的说话人声音分离项目
在实际的开发中可能会遇到这样的问题,老板让你把音频中的每个讲话人的声音分离成不同的音频片段。你可以使用au等专业的音频处理软件手动分离。但是这样效率太慢了,现在ai这么发达,我们能否借助ai之力来分离一条音频中的不同的说话人呢?答案是肯定可以的。 这里将利用声纹识别加上语音识别来对音频中不同的说话人进行语者分离。