音频基础知识（二）

最简易的音视频图解，包括一下几个部分：

于一个实时音视频应用共包括几个环节：采集、编码、前后处理、传输、解码、缓冲、渲染等很多环节。每一个细分环节，还有更细分的技术模块。比如，前后处理环节有美颜、滤镜、回声消除AEC、噪声抑制NS、静音控制VAD、自动增益控制AGC等，采集有麦克风阵列等，编解码有VP8、VP9、H.264、H.265等。

典型的实时音视频应用数据流转过程如下：

下面这张图可能更具体一点：

整个图包含了音视频数据从打包、编解码、传输、推拉流、播放等整个过程，这里边包含了很多音视频基础知识，下边归纳整理一下。

音频相关：

CDN构成：

①边缘结点：用户会先从边缘结点获取服务；

②二级结点（主干结点）：主要是用于缓存，减轻源站的压力。如果边缘结点没有服务，会先从主干结点上拉取缓存的数据到边缘结点，然后用户再从边缘结点获取数据；

③源站：（会有多个源节点）内容提供商会将内容放在源站上。如果边缘结点和主干结点都没有获取到服务，则会访问源站。

常用工具：

①ffmpeg

②ffplay:也是基于ffmpeg

③flashplayer
音频三要素：

①音调（音频）

②音量

③音色（根材质有关）
听觉范围：

①<20HZ，次声波

②20HZ~20KHZ，可以听见的

③>20KHZ，超声波

音频的量化与标准

①采样大小：也就是采样的纵坐标对应的值，表示一个采样用多少位存放。一般为16bit(2^16 = 65535)，也可以是8位，但是8位对应的是256，比较小，一般采用16位。

②采样率：一般由8k,16k,32k,44.1k(AAC用这个)，48k

可以把它理解为，要采集的总量，拿44.1k举例，比如说，现在要采集20HZ的，就要采集（44100/20=）2000次，而要采集20KHZ的，就要采集（44100/20000=）2次；

③声道：单声道、双声道、多声道（上下左右等都有一个喇叭）
码率：

采样率 x 采样大小 x 声道数

比如：

采样率为：44.1k

采用大小为：16bit

双声道的PCM编码的WAV文件，它的码率为：

44.1k x 16 x 2=1411.2kb/s--->除以8--->176.4kB/s

音频的压缩技术：

有损压缩(就是说还原回来的数据和原数据不一样)：消除冗余的数据

人耳听不到的声音：<20HZ或 >20kHZ的

被遮蔽掉的声音（受频域和时域的影响）

无损压缩：哈夫曼无损编码