音频AAC编码与RV1126的AENC模块的讲解

一.音频编码的原理

AAC编码的基本概念

AAC（Advanced Audio Coding）是一种高级音频编码格式，旨在提供比MP3更高的音质和更低的比特率。AAC是MPEG-2和MPEG-4标准的一部分，广泛应用于音乐、视频流媒体和广播等领域

音频为什么要进行编码压缩？我们就以PCM原始数据为例，假设这个PCM数据采样率为：48000、采样深度：16bit、声道数：2。对应的码率是：48000 * 16bit * 2 = 1536000bps ~=1.46M ，若传输一分钟那就是1.46M * 60S~ = 87.6M。这个数据量是非常大，若在网络传输上这个音频的数据量很容易造成网络的负载压力。所以此时我们就需要对音频进行编码压缩，音频编码压缩格式分很多种，比方说：MP3、AAC、OGG格式。我们的课程重点来说AAC编码格式，因为AAC编码在网络传输中质量最好，并且AAC的压缩比高达1:18，是所有音频编码技术中压缩比最高。

1.AAC编码的特点

每个AAC音频帧包含了多个音频采样的压缩数据，AAC的一个音频帧包含1024个采样值。由于原始数据块它是以帧的形式存在，我们称之为原始帧。

在AAC中一般有两种方式来封装，一种是ADIF，另外一种是ADTS。

2.ADIF 格式

音频数据交换格式，这种格式必须在定义的音频数据流进行处理，基本上用于存储磁盘文件中

3.ADTS 格式

音频数据传输流，这种格式是最常用的格式。它的特点是会同步字的比特流，并且允许在音频数据流任意帧解码。换言之，就是它的每一帧都有信息头，一个是AAC原始数据长度是可变，对原始帧加上ADTS头进行封装就生成ADTS帧。

AAC的每一帧数据由ADTS Header和AAC Audio Data组成，其中ADTS Header占有7个字节-9个字节。

ADTS Header由两部分组成分别是：固定头部信息 (adts_fixed_header)和可变头信息 (adts_variable_header)，固定头信息指的是数据每一帧都是相同的 ，它主要定义了音频的采样率、声道数、帧长度等信息；**可变头信息则主要描述帧和帧之间的可变。**下面是adts帧的结构