基本概念
三巨头:采样率、采样格式,声道数与声道布局、
PCM、音质、音频编码格式、音频封装格式
采样率: 每秒采集的样本数量
我们知道声音是连续的一段波,
模拟信号的波形是无限光滑的,可以看成由无数个点组成,由于存储空间是相对有限的,数字编码过程中,必须要对波形的点进行采样。采样(Sampling):每隔一段时间采集一次模拟信号的样本,是一个在时间上将模拟信号离散化(把连续信号转换成离散信号)的过程。
每秒采集的样本数量,称为采样率(采样频率,采样速率,Sampling Rate)。比如,采样率44.1kHz表示1秒钟采集44100个样本。
采样格式 也叫 位深度:
每秒采集 44100个,那么采集的这个点的数据用多大的位数表示呢?
例如用 8 bit 的表示 000-111
或者用16 bit 的表示 0000 - 1111
位深度(采样精度,采样大小,Bit Depth):使用多少个二进制位来存储一个采样点的样本值。位深度越高,表示的振幅越精确。常见的CD采用16bit的位深度,能表示65536(216)个不同的值。DVD使用24bit的位深度,大多数电话设备使用8bit的位深度。
声道数与声道布局、
单声道产生一组声波数据,双声道(立体声)产生两组声波数据。
采样率44.1kHZ、位深度16bit的立体声PCM数据的比特率是多少?
- 采样率 * 位深度 * 声道数 * 时间
- 44100 * 16 * 2 * 60 = 84,672,000 bit
- 84,672,000 / 8 = 10,584,000 byte
- 10,584,000 / 1024 = 10,335.9375KB
- 10,335 /1024 = 10.09368896484375MB
也就是说,在一分钟之内,光是音频就有10M,因此一定要通过基础进行处理。
------------------------------------------
比特率(Bit Rate),指单位时间内传输或处理的比特数量,
单位是:比特每秒(bit/s或bps),还有:千比特每秒(Kbit/s或Kbps)、兆比特每秒(Mbit/s或Mbps)、吉比特每秒(Gbit/s或Gbps)、太比特每秒(Tbit/s或Tbps)。
采样率44.1kHZ、位深度16bit的立体声PCM数据的比特率是多少?
- 采样率 * 位深度 * 声道数
- 44100 * 16 * 2 = 1411.2Kbps
通常,采样率、位深度越高,数字化音频的质量就越好。从比特率的计算公式可以看得出来:比特率越高,数字化音频的质量就越好。
PCM
将音频数字化的常见技术方案是脉冲编码调制 (PCM,Pulse Code Modulation),主要过程是:采样 → 量化(实际上就是采样格式) → 编码。
音频编码格式、
前面看到,在一分钟之内,光是音频就有10M,因此一定要通过基础进行处理。
处理的技术就是将原始的 录制 到的PCM 信息转化成 .mp3,.mp4, .aac等格式。
总结:
对于音频,一定要知道 采样率,采样格式,声道数
采样率: Sampling Rate 44100.
采样格式:16 bit, 32 bit,
声道数: 1为单声道,2 为立体声
播放pcm时,必须得设置采样率(-ar )、采样格式(-f )、 声道数(-ac)