视频中有无声音的检测

最近遇到一个烦心的事,晚上车停在路边车窗被砸了,行车记录仪正好没安装好,没有拍到,需要对视频声音进行分析确定被砸时间,但我的行车记录仪是每一分钟拍一个视频,一晚上的视频非常多,听起来非常浪费时间,废话不多说,开干。这里提供一个视频中有无声音的检测用例:

python 复制代码
import os
import subprocess
import librosa
import numpy as np

def extract_audio_from_video(video_file_path, output_audio_file_path):
    # 使用ffmpeg提取音频
    try:
        subprocess.run(['ffmpeg', '-i', video_file_path, '-vn', '-acodec', 'pcm_s16le', '-ar', '44100', '-ac', '2', output_audio_file_path], check=True)
    except subprocess.CalledProcessError as e:
        print(f"提取音频时出现错误: {e}")

def main():
    # 视频文件路径
    video_file_path = r"D:\Viidure\2024_03_11_201220_00.MP4"

    # 临时音频文件路径
    temp_audio_file_path = r"D:\Viidure\temp_audio.wav"

    # 提取音频
    extract_audio_from_video(video_file_path, temp_audio_file_path)

    # 加载音频文件
    try:
        y, sr = librosa.load(temp_audio_file_path, sr=None)  # sr=None 表示使用音频文件的原始采样率
    except Exception as e:
        print(f"加载音频文件时出现错误: {e}")
        return

    # 计算梅尔频谱图
    S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128)

    # 计算音频频谱的分贝值
    loudness = librosa.power_to_db(S, ref=np.max(S))

    # 获取频率轴
    frequencies = librosa.core.fft_frequencies(sr=sr)

    # 检查每个频率的声音强度是否在人耳的听觉范围内
    for f, dB in zip(frequencies, loudness):
        # print(type(f))
        # print(type(dB))

        if 2000 <= f <= 20000:
            if np.any(dB > -40):  # -40 dB作为听觉阈值的一个参考
                # print("------------------------------------------------------")
                print(f"频率 {f} Hz ,人耳能够听见。")
            # else:
            #     print("------------------------------------------------------")
            #     print(f"频率 {f} Hz 的声音强度为 {dB} dB,低于听觉阈值。")

    # print("------------------------------------------------------")

    # 删除临时音频文件
    try:
        os.remove(temp_audio_file_path)
    except Exception as e:
        print(f"删除临时音频文件时出现错误: {e}")

if __name__ == "__main__":
    main()
相关推荐
EasyCVR6 小时前
国标GB28181视频监控平台EasyCVR行业解决方案深度解读——雪亮工程、智慧城市与智慧交通
人工智能·音视频·智慧城市
“码”力全开9 小时前
打破芯片与协议壁垒:基于 Docker + 边缘计算的 GB28181/RTSP 视频智能管理平台架构设计与源码交付方案
docker·音视频·边缘计算
AI服务老曹17 小时前
解密企业级视频中台:基于 GB28181/RTSP 统一接入与边缘计算的 AI 视频管理平台(附 Docker 部署与源码交付方案)
人工智能·音视频·边缘计算
shandianchengzi17 小时前
【记录】LosslessCut|Linux下配置开源无损剪辑软件 LosslessCut AppImage 命令行启动和设置图标
linux·运维·服务器·音视频·视频·剪辑
zhaoshuzhaoshu17 小时前
无线耳机的音频传输时延技术对比总结
音视频
ai产品老杨18 小时前
深度解析:基于 Docker 与异构计算的下一代 AI 视频管理平台架构(附 GB28181/RTSP 统一接入与源码交付方案)
人工智能·docker·音视频
hz5678919 小时前
2026主流RTC音视频SDK选型全解析:性能对比+避坑指南+国产化适配深度横评
云计算·音视频·实时音视频·信息与通信
AI前沿资讯19 小时前
哪个AI 3D创作工具更适合视频创作?——2026年V2Fun实战指南
人工智能·3d·音视频
EasyDSS19 小时前
企业融媒体平台/私有化视频会议解决方案EasyDSS重构企业视频高效运维体系
重构·音视频·媒体
2601_9578822420 小时前
多模态RAG与视觉红利:GEO(生成式引擎优化)中的图片与视频资产重构策略
重构·音视频·geo·rag·多模态模型