音视频开发2 音频基础

基本概念

三巨头:采样率、采样格式,声道数与声道布局、

PCM、音质、音频编码格式、音频封装格式

采样率: 每秒采集的样本数量

我们知道声音是连续的一段波,

模拟信号的波形是无限光滑的,可以看成由无数个点组成,由于存储空间是相对有限的,数字编码过程中,必须要对波形的点进行采样。采样(Sampling):每隔一段时间采集一次模拟信号的样本,是一个在时间上将模拟信号离散化(把连续信号转换成离散信号)的过程。

每秒采集的样本数量,称为采样率(采样频率,采样速率,Sampling Rate)。比如,采样率44.1kHz表示1秒钟采集44100个样本。

采样格式 也叫 位深度:

每秒采集 44100个,那么采集的这个点的数据用多大的位数表示呢?

例如用 8 bit 的表示 000-111

或者用16 bit 的表示 0000 - 1111

位深度(采样精度,采样大小,Bit Depth):使用多少个二进制位来存储一个采样点的样本值。位深度越高,表示的振幅越精确。常见的CD采用16bit的位深度,能表示65536(216)个不同的值。DVD使用24bit的位深度,大多数电话设备使用8bit的位深度。

声道数与声道布局、

单声道产生一组声波数据,双声道(立体声)产生两组声波数据。

采样率44.1kHZ、位深度16bit的立体声PCM数据的比特率是多少?

  • 采样率 * 位深度 * 声道数 * 时间
  • 44100 * 16 * 2 * 60 = 84,672,000 bit
  • 84,672,000 / 8 = 10,584,000 byte
  • 10,584,000 / 1024 = 10,335.9375KB
  • 10,335 /1024 = 10.09368896484375MB

也就是说,在一分钟之内,光是音频就有10M,因此一定要通过基础进行处理。

------------------------------------------

比特率(Bit Rate),指单位时间内传输或处理的比特数量,

单位是:比特每秒(bit/s或bps),还有:千比特每秒(Kbit/s或Kbps)、兆比特每秒(Mbit/s或Mbps)、吉比特每秒(Gbit/s或Gbps)、太比特每秒(Tbit/s或Tbps)。

采样率44.1kHZ、位深度16bit的立体声PCM数据的比特率是多少?

  • 采样率 * 位深度 * 声道数
  • 44100 * 16 * 2 = 1411.2Kbps

通常,采样率、位深度越高,数字化音频的质量就越好。从比特率的计算公式可以看得出来:比特率越高,数字化音频的质量就越好。

PCM

将音频数字化的常见技术方案是脉冲编码调制PCM,Pulse Code Modulation),主要过程是:采样 → 量化(实际上就是采样格式) → 编码。

音频编码格式、

前面看到,在一分钟之内,光是音频就有10M,因此一定要通过基础进行处理。

处理的技术就是将原始的 录制 到的PCM 信息转化成 .mp3,.mp4, .aac等格式。

总结:

对于音频,一定要知道 采样率,采样格式,声道数

采样率: Sampling Rate 44100.

采样格式:16 bit, 32 bit,

声道数: 1为单声道,2 为立体声

播放pcm时,必须得设置采样率(-ar )、采样格式(-f )、 声道数(-ac

相关推荐
Antonio9152 小时前
【音视频】SDL简介
音视频·sdl
薛瑄2 小时前
FFmpeg之三 录制音频并保存, API编解码从理论到实战
ffmpeg·音视频·xcode
算家云4 小时前
AI音频核爆!Kimi开源“六边形战士”Kimi-Audio,ChatGPT语音版?
人工智能·音视频·kimi·算家云·kimi-audio·租算力,到算家云
Everbrilliant896 小时前
音视频之H.265/HEVC熵编码
音视频·h.265·算术编码·哈夫曼编码·熵编码·指数哥伦布编码·熵编码的基本原理
Panesle6 小时前
月之暗面开源-音频理解、生成和对话生成模型:Kimi-Audio-7B-Instruct
人工智能·音视频·语音生成
Antonio9158 小时前
【音视频】音频编码实战
ffmpeg·音视频
BO_S__17 小时前
python调用ffmpeg对截取视频片段,可批量处理
python·ffmpeg·音视频
亦双城的双子娴18 小时前
通过音频的pcm数据格式利用canvas绘制音频波形图
音视频·pcm·canva可画
Antonio9151 天前
【音视频】⾳频处理基本概念及⾳频重采样
ffmpeg·音视频·aac
电子科技圈1 天前
XMOS空间音频——在任何设备上都能提供3D沉浸式空间音频且实现更安全地聆听
经验分享·设计模式·性能优化·计算机外设·音视频