音频AAC编码与RV1126的AENC模块的讲解

一.音频编码的原理

AAC编码的基本概念

AAC(Advanced Audio Coding)是一种高级音频编码格式,旨在提供比MP3更高的音质和更低的比特率。AAC是MPEG-2和MPEG-4标准的一部分,广泛应用于音乐、视频流媒体和广播等领域

音频为什么要进行编码压缩?我们就以PCM原始数据为例,假设这个PCM数据采样率为:48000、采样深度:16bit、声道数:2。对应的码率是:48000 * 16bit * 2 = 1536000bps ~=1.46M 若传输一分钟那就是1.46M * 60S~ = 87.6M。这个数据量是非常大,若在网络传输上这个音频的数据量很容易造成网络的负载压力。所以此时我们就需要对音频进行编码压缩,音频编码压缩格式分很多种,比方说:MP3、AAC、OGG格式。我们的课程重点来说AAC编码格式,因为AAC编码在网络传输中质量最好,并且AAC的压缩比高达1:18,是所有音频编码技术中压缩比最高。

1.AAC编码的特点

每个AAC音频帧包含了多个音频采样的压缩数据,AAC的一个音频帧包含1024个采样值。由于原始数据块它是以帧的形式存在,我们称之为原始帧。

在AAC中一般有两种方式来封装,一种是ADIF,另外一种是ADTS。

2.ADIF 格式

音频数据交换格式,这种格式必须在定义的音频数据流进行处理,基本上用于存储磁盘文件中

3.ADTS 格式

音频数据传输流,这种格式是最常用的格式。它的特点是会同步字的比特流,并且允许在音频数据流任意帧解码。换言之,就是它的每一帧都有信息头,一个是AAC原始数据长度是可变,对原始帧加上ADTS头进行封装就生成ADTS帧。

AAC的每一帧数据由ADTS Header和AAC Audio Data组成,其中ADTS Header占有7个字节-9个字节。

ADTS Header由两部分组成分别是:固定头部信息 (adts_fixed_header)和可变头信息 (adts_variable_header),固定头信息指的是数据每一帧都是相同的 ,它主要定义了音频的采样率、声道数、帧长度等信息;**可变头信息则主要描述帧和帧之间的可变。**下面是adts帧的结构

4.adts_fixed_header 的参数:

图二:采样率下标和采样率关系

5.adts_variable_header的参数:

二.RV1126的AENC模块的讲解

RV1126 AENC 模块的介绍

RV1126的AENC模块是音频编码模块 ,主要是对AI模块进来的数据进行**音频编码压缩处理,**并输出对应的音频压缩码流,下面是AENC模块在RV1126里面和AI模块的关系。

RV1126的 AENC 模块参数

设置AENC模块的是AENC_CHN_ATTR_S 结构体,下面我们重点看看这个结构体属性的具体定义:

1.enCodecType 音频编码协议类型,下面是AENC支持的音频编码格式

2.u32Bitrate 音频编码比特率,音频编码每秒传输的数据量。

AAC 编码协议推荐使用 64kpbs(64000bps)

G711A G711U 编码协议推荐使用 64kps(64000bps)

G726 推荐使用 32kpbs(32000bps)

3. u32Quality: 音频编码质量,默认是1

4.stAencAAC stAencMp2 stAencG711A stAencG711U stAencG726 这几个结构体是不同的音频编码器的专门协议属性结构体

4.1 .stAencAAC**:它是** AAC 编码协议属性

u32Channels **:**编码通道数

u32SampleRate **:**音频采样率,AAC的采样率范围是7350-96000

4.2 .stAencMp2**:** 它是MP2编码协议属性

u32Channels **:**编码通道数

u32SampleRate **:**音频采样率

相关推荐
眠りたいです12 小时前
使用LangChain进行AI应用构建-快速上手,定义模型和调用工具部分
人工智能·langchain·llm·ollama·python3.13
中科天工12 小时前
智装升级:工业4.0时代的高效包装革命
大数据·人工智能·智能
爱喝可乐的老王12 小时前
机器学习监督学习模型----KNN
人工智能·算法·机器学习
丝斯201112 小时前
AI学习笔记整理(54)——大模型之Agent 智能体开发前沿技术
人工智能·笔记·学习
Black蜡笔小新12 小时前
视频汇聚平台EasyCVR破解偏远地区监控难题的技术实践
音视频
优爱蛋白12 小时前
基于活性探针策略的Bromodomain蛋白质功能研究
人工智能·健康医疗
晨非辰12 小时前
C++波澜壮阔40年|类和对象篇:拷贝构造与赋值重载的演进与实现
运维·开发语言·c++·人工智能·后端·python·深度学习
网络安全研发随想12 小时前
AI Code编辑器到底是怎么做出来的?
人工智能·编辑器
2501_9418372612 小时前
龙虾性别分类与未定义类别识别模型训练 tood_r50_fpn_ms-2x_coco实现详解_1
人工智能·分类·数据挖掘
彩虹糖_haha12 小时前
多线程并发处理模式详解
人工智能·计算机视觉