vad

温柔哥`13 天前
人工智能·大语言模型·vad·视频异常检测·llms·vlms·training-free
MCANet: 基于多模态字幕感知的大语言模型训练无关视频异常检测ICPR’24 - 印度卡利卡特国立理工学院 MCANet: Multimodal Caption Aware Training-Free Video Anomaly Detection via Large Language Model
伊织code6 个月前
python·whisper·openai·asr·语音·vad·whisperx
WhisperXWhisperX:具有字级时间戳的自动语音识别(和分类)该存储库提供快速语音识别(70倍实时与big-v2)与字级时间戳和说话人分类。
知来者逆10 个月前
深度学习·计算机视觉·vad·视频异常检测·监控视频
计算机视觉——基于深度学习检测监控视频发生异常事件的算法实现视频异常检测(VAD)是一门旨在自动化监控视频分析的技术,其核心目标是利用计算机视觉系统来监测监控摄像头的画面,并自动检测其中的异常或非常规活动。随着监控摄像头在各种场合的广泛应用,人工监视已经变得不切实际,因为这一任务既单调又耗时。此外,监控设备的快速增长使得用人工有效监视大量摄像头变得日益困难,因此迫切需要自动化的解决方案。
东城青年1 年前
vad·语音激活检测·端点检测
基于双级阈值及过零率的语音激活检测(VAD)语音激活检测(Voice Activity Detection, VAD):也称为端点检测,目的就是要找到音频信号的开始和结束位置。