FFmpeg 解复用过程

本章使用 FFmpeg 进行多媒体文件解复用(Demuxing)过程的完整讲解。

流程概述

  1. 初始化 FFmpeg 库:加载多媒体处理所需的库。
  2. 打开输入文件:使用 FFmpeg 的 API 打开多媒体文件。
  3. 解析文件信息:读取文件的头部,分析其中的流信息。
  4. 提取流数据:从容器中提取视频流、音频流等数据。
  5. 写入输出文件(可选):将解复用后的数据保存为单独的文件。

使用 FFmpeg 命令行解复用

sh 复制代码
# 从 input.mp4 解复用视频流和音频流
ffmpeg -i input.mp4 -c:v copy -an output_video.h264  # 提取视频流
ffmpeg -i input.mp4 -c:a copy -vn output_audio.acc	# 提取音频流
  • -c:v copy:复制视频流(无需重新编码)
  • -an:忽略音频流
  • -c:a copy:复制音频流(无需重新编码)
  • -vn:忽略视频流

使用 FFmpeg API 进行解复用

以下是使用 C 编写的解复用代码示例

c 复制代码
#include <libavformat/avformat.h>
#include <libavcodec/avcodec.h>

int main(int argc, char *argv[]) {
	if(argc < 2) {
		printf("Usage: %s <input file>\n", argv[0]);
		return -1;
	}

	const char *input_file = argv[1];
	AVFormatContext *fmt_ctx = NULL;
	AVPacket packet;

	// 初始化 FFmpeg 库
	av_register_all();		// 高版本不需要注册

	// 打开输入文件
	if(avformat_open_input(&fmt_ctx, input_file, NULL, NULL) < 0) {
		fprintf(stderr, "Could not open input file %s\n", input_file);
		return -1;
	}
	
	// 解析流信息
	if(avformat_find_stream_info(fmt_ctx, NULL) < 0 ){
		fprintf(stderr, "Could not find stream information\n");
		avformat_close_input(&fmt_ctx);
		return -1;
	}
	
	// 打印流信息
	av_dump_fromat(fmt_ctx, 0, input_file, 0);

	// 解复用或称:读取每个数据包并分类处理
	while(av_read_frame(fmt_ctx, &packet) >= 0){
		if(packet.stream_index == fmt_ctx->streams[0]->index) {
			// 视频流
			printf("Video packet size: %d\n", packet.size);
			// 从这里可以写入到文件或进一步处理
		} else if(packet.stream_index == fmt_ctx->streams[1]->index){
			// 音频流
			printf("Audio packet size: %d\n", packet.size);
			// 从这里可以写入到文件或进一步处理
		}
		av_packet_unref(&packet);
	} 
	
	// 释放资源
	avformat_close_input(&fmt_ctx);
	return 0;
} 

代码说明

  1. 初始化 FFmpeg 库:
c 复制代码
av_register_all();
  1. 打开输入文件:
c 复制代码
avformat_open_input(&fmt_ctx, input_file, NULL, NULL);

创建一个 AVFormatContext 对象,存储输入文件的信息。

  1. 解析文件信息:
c 复制代码
avformat_find_stream_info(fmt_ctx, NULL);

分析文件头部,获取流信息。

  1. 读取数据包:
c 复制代码
while(av_read_frame(fmt_ctx, &packet) >= 0) { ... }

按帧读取数据包,并根据 stream_index 将其分为视频流或音频流。

  1. 处理流数据:
  • 视频流:写入 .h264 文件。
  • 音频流:写入 .aac 文件。
  1. 释放资源:
c 复制代码
avformat_close_input(&fmt_ctx);

释放内存,关闭文件。

扩展与优化

  • 多线程: 可以优化解复用速度。
  • 音视频同步: 使用时间戳(PTS 和 DTS)确保音视频同步。
  • 错误处理: 添加对异常情况的处理,如文件损坏或不支持的编码格式。
相关推荐
却道天凉_好个秋4 小时前
音视频学习(三十六):websocket协议总结
websocket·音视频
【余185381628006 小时前
碰一碰发视频源码搭建定制化开发:支持OEM
音视频
EQ-雪梨蛋花汤6 小时前
【Part 3 Unity VR眼镜端播放器开发与优化】第四节|高分辨率VR全景视频播放性能优化
unity·音视频·vr
菜包eo10 小时前
基于二维码的视频合集高效管理与分发技术
音视频
文浩(楠搏万)10 小时前
用OBS Studio录制WAV音频,玩转语音克隆和文本转语音!
大模型·音视频·tts·wav·obs·声音克隆·语音录制
aqi0016 小时前
FFmpeg开发笔记(七十二)Linux给FFmpeg集成MPEG-5视频编解码器EVC
android·ffmpeg·音视频·流媒体
花开花落的个人博客18 小时前
ESP32-S3开发板播放wav音频
音视频
顾道长生'1 天前
(Arxiv-2025)通过动态 token 剔除实现无需训练的高效视频生成
计算机视觉·音视频·视频生成
每次的天空1 天前
Android-自定义View的实战学习总结
android·学习·kotlin·音视频
爱分享的飘哥1 天前
【V6.0 - 听觉篇】当AI学会“听”:用声音特征捕捉视频的“情绪爽点”
人工智能·音视频