技术栈
vad
伊织code
3 个月前
python
·
whisper
·
openai
·
asr
·
语音
·
vad
·
whisperx
WhisperX
WhisperX:具有字级时间戳的自动语音识别(和分类)该存储库提供快速语音识别(70倍实时与big-v2)与字级时间戳和说话人分类。
知来者逆
7 个月前
深度学习
·
计算机视觉
·
vad
·
视频异常检测
·
监控视频
计算机视觉——基于深度学习检测监控视频发生异常事件的算法实现
视频异常检测(VAD)是一门旨在自动化监控视频分析的技术,其核心目标是利用计算机视觉系统来监测监控摄像头的画面,并自动检测其中的异常或非常规活动。随着监控摄像头在各种场合的广泛应用,人工监视已经变得不切实际,因为这一任务既单调又耗时。此外,监控设备的快速增长使得用人工有效监视大量摄像头变得日益困难,因此迫切需要自动化的解决方案。
东城青年
1 年前
vad
·
语音激活检测
·
端点检测
基于双级阈值及过零率的语音激活检测(VAD)
语音激活检测(Voice Activity Detection, VAD):也称为端点检测,目的就是要找到音频信号的开始和结束位置。