音频采样数据格式

melonbo2024-11-14 21:48

音频信号在模拟到数字转换时，会涉及到多个关键参数，如采样率、位深度、通道数等。下面是常见的音频采样数据格式及其相关概念：

1. 采样率 (Sample Rate)

采样率指的是每秒钟对音频信号进行采样的次数，单位为赫兹 (Hz)。常见的值如下：

44.1 kHz：常用于音频CD和大多数音乐文件格式（如WAV、MP3）。
48 kHz：常用于专业音频录制、电影和视频音频处理。
96 kHz、192 kHz：常用于高保真音频（Hi-Fi）或专业录音应用。

为了能够准确地重现模拟音频信号中的所有频率，采样率必须遵循 奈奎斯特定理（Nyquist Theorem），即采样率必须至少是信号中最高频率的两倍。这是因为我们只能重建出采样频率以下的信号，超过采样频率一半的信号（即奈奎斯特频率）会出现混叠现象，导致音频失真。

44.1 kH采样率的由来

早期的数码录音就是一个PCM编码器加录像机，所以，数据音频信号是在录像机（录像带）中存储的。PAL制式的录像机每帧有625条扫描线，但实际可用的扫描线为588条，由于隔行扫描，扫描线减半，就成了294条。每条扫描线可以存储3个采样点的信息，场频为50Hz，因而采样点数量为294×50×3 = 44 100。

2. 位深度 (Bit Depth)

位深度指的是每个采样点的数值精度，即每个采样值所用的比特数。常见的值如下：

16位：用于CD音质（动态范围为96 dB）。
24位：用于高质量录音和制作，通常用于专业音频处理。
32位浮动：用于数字音频处理软件中的浮动点格式，提供极高的动态范围。

3. 通道数 (Channels)

指的音频信号中的声道数。如下图，当我们坐在中间时，不同声道的声音让我们感觉它们来自不同的方向。