音视频开发35 FFmpeg 编码- 将YUV 和 pcm合成一个mp4文件

一 程序的目的

/***

*该程序的目的是:

* 将 一个pcm文件 和 一个 yuv文件,合成为一个 0804_out.mp4文件

* pcm文件和yuv文件是从哪里来的呢?是从 sound_in_sync_test.mp4 文件中,使用ffmpeg命令 抽取出来的。

* 这样做的目的是为了对比前后两个mp4(sound_in_sync_test.mp4 和 0804_out.mp4 ) 文件。

*

* 1. 从sound_in_sync_test.mp4 文件 中抽取 pcm命令如下:

*ffmpeg -i sound_in_sync_test.mp4 -vn -ar 44100 -ac 2 -f s16le 44100_2_s16le.pcm

* -vn 表示不处理视频

*

* 2. 从sound_in_sync_test.mp4 文件 中抽取 yuv命令如下:

*

*ffmpeg -i sound_in_sync_test.mp4 -pix_fmt yuv420p 720x576_yuv420p.yuv

*

* 3.播放测试

* 对于 pcm 数据
ffplay -ac 2 -ar 44100 -f s16le 44100_2_s16le.pcm

* 对于 YUV 数据
ffplay -pixel_format yuv420p -video_size 720x576 -framerate 25 720x576_yuv420p.yuv

***/

原始 sound_in_sync_test.mp4的信息

二 流程

1.将pcm 编码成aac

1.1 音频重采样 -- AudioResample

从pcm文件中读取文件后,有一个问题,我们本地的pcm文件可能是 s16le的, 44.1kz, 2声道的。

但是 我们使用的 音频编码器( encoder **)**是 的ffmpeg 自带的aac,而ffmpeg自带的aac仅支持 AV_SAMPLE_FMT_FLTP 采样率的编码器,因此需要重采样,也就是说要将s16le的变成f32p的。

1.2 aac 设置参数问题

需要设定的参数

aac

采样率,声道数,采样格式,比特率,pts

aac 和 h264 在编码的时候,编码器上下文的很多参数都是可以设定好的,但是有些参数是不好设置的,其中比较不容易理解的就是pts(显示时间),

复制代码
aac在编码的时候,要设置好pts,pts是显示时间,

我们这样思考,pcm 一秒钟有44100个样本,那么一秒钟处理的样本数量为 1/44100秒,

那么当一个aac帧有1024 个采样点的时候,对于pcm来说,所谓的显示时间就是播放时间,因此每次处理一帧(包括播放时间和编码时间)(也就是1024个采样点的时间),

1024*1/44100秒 = 0.0232199546485261秒 = 23.2199546485261毫秒= 23219.9546485261微妙

我们在使用pts单位的时候,会以微妙为单位。

注意的是,这里需要设置到AAC encoder Context 里面。

2.将yuv编码成h264

2.1 将yuv编码成h264时需要设定的参数

分辨率,像素格式,帧率,比特率,b帧有多少个,pts

同理,h264在编码的时候,要设置好pts,pts是显示时间,

我们设置的25图片/秒,也就是40毫秒一张图片,40000微妙一张图片

当我们显示一张图片的时候,pts就应该以 40000微妙为一个单位,注意这里需要设置到 H264 encoder context 里面

3.将aac 和 h264 打包成 mp4

3.0 设计

初始化,销毁,avio_open,

3.1 使用 newstream

在将aac文件和 h264文件打包的时候,首先要先有 AVStream 才好打包。

因此要使用到 new stream,第二个参数没有用,

复制代码
AVStream *avformat_new_stream(AVFormatContext *s, const struct AVCodec *c);
复制代码

3.2 时间同步问题 time_base问题

3.3 合成mp4文件,还有一个点,帧率问题,sps 和 pps 问题(这个好像是 mp4文件的)

相关推荐
REDcker5 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo19985 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君5 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥5 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_416276425 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk5 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS5 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_416276425 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_4582838685 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川5 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频