FFmpeg 解复用过程

本章使用 FFmpeg 进行多媒体文件解复用(Demuxing)过程的完整讲解。

流程概述

  1. 初始化 FFmpeg 库:加载多媒体处理所需的库。
  2. 打开输入文件:使用 FFmpeg 的 API 打开多媒体文件。
  3. 解析文件信息:读取文件的头部,分析其中的流信息。
  4. 提取流数据:从容器中提取视频流、音频流等数据。
  5. 写入输出文件(可选):将解复用后的数据保存为单独的文件。

使用 FFmpeg 命令行解复用

sh 复制代码
# 从 input.mp4 解复用视频流和音频流
ffmpeg -i input.mp4 -c:v copy -an output_video.h264  # 提取视频流
ffmpeg -i input.mp4 -c:a copy -vn output_audio.acc	# 提取音频流
  • -c:v copy:复制视频流(无需重新编码)
  • -an:忽略音频流
  • -c:a copy:复制音频流(无需重新编码)
  • -vn:忽略视频流

使用 FFmpeg API 进行解复用

以下是使用 C 编写的解复用代码示例

c 复制代码
#include <libavformat/avformat.h>
#include <libavcodec/avcodec.h>

int main(int argc, char *argv[]) {
	if(argc < 2) {
		printf("Usage: %s <input file>\n", argv[0]);
		return -1;
	}

	const char *input_file = argv[1];
	AVFormatContext *fmt_ctx = NULL;
	AVPacket packet;

	// 初始化 FFmpeg 库
	av_register_all();		// 高版本不需要注册

	// 打开输入文件
	if(avformat_open_input(&fmt_ctx, input_file, NULL, NULL) < 0) {
		fprintf(stderr, "Could not open input file %s\n", input_file);
		return -1;
	}
	
	// 解析流信息
	if(avformat_find_stream_info(fmt_ctx, NULL) < 0 ){
		fprintf(stderr, "Could not find stream information\n");
		avformat_close_input(&fmt_ctx);
		return -1;
	}
	
	// 打印流信息
	av_dump_fromat(fmt_ctx, 0, input_file, 0);

	// 解复用或称:读取每个数据包并分类处理
	while(av_read_frame(fmt_ctx, &packet) >= 0){
		if(packet.stream_index == fmt_ctx->streams[0]->index) {
			// 视频流
			printf("Video packet size: %d\n", packet.size);
			// 从这里可以写入到文件或进一步处理
		} else if(packet.stream_index == fmt_ctx->streams[1]->index){
			// 音频流
			printf("Audio packet size: %d\n", packet.size);
			// 从这里可以写入到文件或进一步处理
		}
		av_packet_unref(&packet);
	} 
	
	// 释放资源
	avformat_close_input(&fmt_ctx);
	return 0;
} 

代码说明

  1. 初始化 FFmpeg 库:
c 复制代码
av_register_all();
  1. 打开输入文件:
c 复制代码
avformat_open_input(&fmt_ctx, input_file, NULL, NULL);

创建一个 AVFormatContext 对象,存储输入文件的信息。

  1. 解析文件信息:
c 复制代码
avformat_find_stream_info(fmt_ctx, NULL);

分析文件头部,获取流信息。

  1. 读取数据包:
c 复制代码
while(av_read_frame(fmt_ctx, &packet) >= 0) { ... }

按帧读取数据包,并根据 stream_index 将其分为视频流或音频流。

  1. 处理流数据:
  • 视频流:写入 .h264 文件。
  • 音频流:写入 .aac 文件。
  1. 释放资源:
c 复制代码
avformat_close_input(&fmt_ctx);

释放内存,关闭文件。

扩展与优化

  • 多线程: 可以优化解复用速度。
  • 音视频同步: 使用时间戳(PTS 和 DTS)确保音视频同步。
  • 错误处理: 添加对异常情况的处理,如文件损坏或不支持的编码格式。
相关推荐
REDcker6 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo19986 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君6 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥6 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_416276426 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk6 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS6 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_416276426 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_4582838687 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川7 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频