技术栈
vad
温柔哥`
13 天前
人工智能
·
大语言模型
·
vad
·
视频异常检测
·
llms
·
vlms
·
training-free
MCANet: 基于多模态字幕感知的大语言模型训练无关视频异常检测
ICPR’24 - 印度卡利卡特国立理工学院 MCANet: Multimodal Caption Aware Training-Free Video Anomaly Detection via Large Language Model
伊织code
6 个月前
python
·
whisper
·
openai
·
asr
·
语音
·
vad
·
whisperx
WhisperX
WhisperX:具有字级时间戳的自动语音识别(和分类)该存储库提供快速语音识别(70倍实时与big-v2)与字级时间戳和说话人分类。
知来者逆
10 个月前
深度学习
·
计算机视觉
·
vad
·
视频异常检测
·
监控视频
计算机视觉——基于深度学习检测监控视频发生异常事件的算法实现
视频异常检测(VAD)是一门旨在自动化监控视频分析的技术,其核心目标是利用计算机视觉系统来监测监控摄像头的画面,并自动检测其中的异常或非常规活动。随着监控摄像头在各种场合的广泛应用,人工监视已经变得不切实际,因为这一任务既单调又耗时。此外,监控设备的快速增长使得用人工有效监视大量摄像头变得日益困难,因此迫切需要自动化的解决方案。
东城青年
1 年前
vad
·
语音激活检测
·
端点检测
基于双级阈值及过零率的语音激活检测(VAD)
语音激活检测(Voice Activity Detection, VAD):也称为端点检测,目的就是要找到音频信号的开始和结束位置。