FFmpeg 结合cut、ffprobe批量以JSON格式查看音视频信息,附带参数详细说明

背景:查看下面audio_info.txt文件中音频的时长等信息。

bash 复制代码
/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0000000000_0000280800_0.000-4.680.wav|slicer_opt|ZH|所以我们猜测这背后也是深渊教团在捣鬼,没错。
/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0000285600_0000729600_4.760-12.160.wav|slicer_opt|ZH|身为侦察骑士看来今后要想办法多多监视深渊教团的家伙了啊,真是不好意思。
/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0000729600_0001055400_12.160-17.590.wav|slicer_opt|ZH|嗯,你们才刚经历大战归来,我就又说起这些严肃的话题啊,对了。
/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0001055400_0001315800_17.590-21.930.wav|slicer_opt|ZH|我记得之前有过约定,要请你们吃蜜酱、胡萝卜煎肉的。
/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0001315800_0001579200_21.930-26.320.wav|slicer_opt|ZH|可后来一直在忙龙灾的事,不如这次就当做庆功。
/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0001579200_0001821000_26.320-30.350.wav|slicer_opt|ZH|我来请你们吃吧,我也好久没吃蜜酱,胡萝卜煎肉了呢。

cut 命令可以按指定的分隔符分割文本,并提取特定的字段。如果你想要使用 cut 命令按"|"分隔符分割文本,并将分割后的结果作为 ffprobe 命令的参数,你可以使用以下步骤:

  1. 使用 cut 命令按"|"分隔符分割文本,并提取你需要的字段。
  2. 使用 xargs 或管道操作将 cut 命令的输出传递给 ffprobe 命令。

以下是一个具体的示例:

假设你有一个文本文件 audio_info.txt,其中包含了一系列的视频文件路径,路径之间用"|"分隔。你想要使用 ffprobe 来获取每个视频文件的元数据。

bash 复制代码
# 使用 cut 命令按"|"分隔,并提取所有字段
cut -d'|' -f1 audio_info.txt | xargs -I % ffprobe -v error -show_format  -print_format json=compact=1 %

在这个示例中:

  • cut -d'|' -f1 audio_info.txt 命令按"|"分隔符分割 audio_info.txt 文件中的内容,并提取第一个字段(即第一个视频文件路径)。
  • xargs -I % ffprobe ... 命令使用 xargscut 命令的输出作为 ffprobe 命令的参数。-I % 选项告诉 xargs 将每个输入项替换为 % 符号,这个符号在 ffprobe 命令中会被替换为实际的视频文件路径。
  • ffprobe -v error -print_format json=compact=1 % 命令使用 ffprobe 工具来获取视频文件的元数据。-v error 选项抑制无关的输出,-print_format json=compact=1 指定输出格式为紧凑的 JSON。

请注意,ffprobe 命令中的 % 符号会被 xargs 替换为 cut 命令的输出,即每个视频文件的路径。

输出结果:

bash 复制代码
{
    "format": { "filename": "/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0000000000_0000280800_0.000-4.680.wav", "nb_streams": 1, "nb_programs": 0, "format_name": "wav", "format_long_name": "WAV / WAVE (Waveform Audio)", "duration": "4.690431", "size": "827470", "bit_rate": "1411332", "probe_score": 99,
        "tags": { "encoder": "Lavf58.29.100" } }
}
{
    "format": { "filename": "/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0000285600_0000729600_4.760-12.160.wav", "nb_streams": 1, "nb_programs": 0, "format_name": "wav", "format_long_name": "WAV / WAVE (Waveform Audio)", "duration": "7.407166", "size": "1306702", "bit_rate": "1411284", "probe_score": 99,
        "tags": { "encoder": "Lavf58.29.100" } }
}
{
    "format": { "filename": "/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0000729600_0001055400_12.160-17.590.wav", "nb_streams": 1, "nb_programs": 0, "format_name": "wav", "format_long_name": "WAV / WAVE (Waveform Audio)", "duration": "5.433469", "size": "958542", "bit_rate": "1411314", "probe_score": 99,
        "tags": { "encoder": "Lavf58.29.100" } }
}
{
    "format": { "filename": "/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0001055400_0001315800_17.590-21.930.wav", "nb_streams": 1, "nb_programs": 0, "format_name": "wav", "format_long_name": "WAV / WAVE (Waveform Audio)", "duration": "4.342132", "size": "766030", "bit_rate": "1411343", "probe_score": 99,
        "tags": { "encoder": "Lavf58.29.100" } }
}
{
    "format": { "filename": "/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0001315800_0001579200_21.930-26.320.wav", "nb_streams": 1, "nb_programs": 0, "format_name": "wav", "format_long_name": "WAV / WAVE (Waveform Audio)", "duration": "4.388571", "size": "774222", "bit_rate": "1411342", "probe_score": 99,
        "tags": { "encoder": "Lavf58.29.100" } }
}
{
    "format": { "filename": "/data/htdocs/demo/GPT-SoVITS/GPT-SoVITS/output/ambor/slicer_opt/vocal_原音频.wav.reformatted.wav_10.wav_0001579200_0001821000_26.320-30.350.wav", "nb_streams": 1, "nb_programs": 0, "format_name": "wav", "format_long_name": "WAV / WAVE (Waveform Audio)", "duration": "4.014150", "size": "708174", "bit_rate": "1411355", "probe_score": 99,
        "tags": { "encoder": "Lavf58.29.100" } }

如果你想要对 audio_info.txt 文件中的每个视频文件都执行 ffprobe 命令,你可以省略 -f1 选项,并且不需要 xargs 中的 -I % 替换,因为 cut 命令的输出将直接通过管道传递给 ffprobe 命令:

bash 复制代码
cut -d'|' audio_info.txt | ffprobe -v error -show_entries format=% -print_format json=compact=1 %

在这个命令中,cut 命令的输出将通过管道直接传递给 ffprobe 命令,每个视频文件路径都会依次作为 ffprobe 命令的参数。

相关推荐
音画拾光1 小时前
4 款音分轨工具推荐:制片帮领衔,轻松搞定音频分离
音视频
软工的小白2 小时前
uniapp开发前端静态视频界面+如何将本地视频转换成网络地址
uni-app·音视频
微笑伴你而行3 小时前
目标检测如何将同时有方形框和旋转框的json/xml标注转为txt格式
xml·目标检测·json
cdcdhj5 小时前
数据库存储大量的json文件怎么样高效的读取和分页,利用文件缓存办法不占用内存
缓存·node.js·json
LeonIter6 小时前
视频判重需求:别为同一内容花两次钱!
音视频·特征提取·重复判定
二川bro7 小时前
第24节:3D音频与空间音效实现
3d·音视频
算家云7 小时前
腾讯最新开源HunyuanVideo-Foley本地部署教程:端到端TV2A框架,REPA策略+MMDiT架构,重新定义视频音效新SOTA!
人工智能·音视频·算家云·hunyuanvideo·模型部署教程·镜像社区
Z_z在努力11 小时前
【杂类】JSON:现代Web开发的数据交换基石
json
我是海飞12 小时前
Tensorflow Lite 的yes/no语音识别音频预处理模型训练教程
python·学习·tensorflow·音视频·嵌入式·语音识别
音视频牛哥12 小时前
具身智能的工程落地:视频-控制闭环的实践路径
人工智能·音视频·人工智能+·具身智能rtsp方案·具身智能rtmp方案·智能机器人rtsp方案·智能机器人rtmp低延迟