音视频开发2 音频基础

基本概念

三巨头:采样率、采样格式,声道数与声道布局、

PCM、音质、音频编码格式、音频封装格式

采样率: 每秒采集的样本数量

我们知道声音是连续的一段波,

模拟信号的波形是无限光滑的,可以看成由无数个点组成,由于存储空间是相对有限的,数字编码过程中,必须要对波形的点进行采样。采样(Sampling):每隔一段时间采集一次模拟信号的样本,是一个在时间上将模拟信号离散化(把连续信号转换成离散信号)的过程。

每秒采集的样本数量,称为采样率(采样频率,采样速率,Sampling Rate)。比如,采样率44.1kHz表示1秒钟采集44100个样本。

采样格式 也叫 位深度:

每秒采集 44100个,那么采集的这个点的数据用多大的位数表示呢?

例如用 8 bit 的表示 000-111

或者用16 bit 的表示 0000 - 1111

位深度(采样精度,采样大小,Bit Depth):使用多少个二进制位来存储一个采样点的样本值。位深度越高,表示的振幅越精确。常见的CD采用16bit的位深度,能表示65536(216)个不同的值。DVD使用24bit的位深度,大多数电话设备使用8bit的位深度。

声道数与声道布局、

单声道产生一组声波数据,双声道(立体声)产生两组声波数据。

采样率44.1kHZ、位深度16bit的立体声PCM数据的比特率是多少?

  • 采样率 * 位深度 * 声道数 * 时间
  • 44100 * 16 * 2 * 60 = 84,672,000 bit
  • 84,672,000 / 8 = 10,584,000 byte
  • 10,584,000 / 1024 = 10,335.9375KB
  • 10,335 /1024 = 10.09368896484375MB

也就是说,在一分钟之内,光是音频就有10M,因此一定要通过基础进行处理。

------------------------------------------

比特率(Bit Rate),指单位时间内传输或处理的比特数量,

单位是:比特每秒(bit/s或bps),还有:千比特每秒(Kbit/s或Kbps)、兆比特每秒(Mbit/s或Mbps)、吉比特每秒(Gbit/s或Gbps)、太比特每秒(Tbit/s或Tbps)。

采样率44.1kHZ、位深度16bit的立体声PCM数据的比特率是多少?

  • 采样率 * 位深度 * 声道数
  • 44100 * 16 * 2 = 1411.2Kbps

通常,采样率、位深度越高,数字化音频的质量就越好。从比特率的计算公式可以看得出来:比特率越高,数字化音频的质量就越好。

PCM

将音频数字化的常见技术方案是脉冲编码调制PCM,Pulse Code Modulation),主要过程是:采样 → 量化(实际上就是采样格式) → 编码。

音频编码格式、

前面看到,在一分钟之内,光是音频就有10M,因此一定要通过基础进行处理。

处理的技术就是将原始的 录制 到的PCM 信息转化成 .mp3,.mp4, .aac等格式。

总结:

对于音频,一定要知道 采样率,采样格式,声道数

采样率: Sampling Rate 44100.

采样格式:16 bit, 32 bit,

声道数: 1为单声道,2 为立体声

播放pcm时,必须得设置采样率(-ar )、采样格式(-f )、 声道数(-ac

相关推荐
国服第二切图仔13 小时前
鸿蒙 Next 如何使用 AVRecorder 从0到1实现视频录制功能(ArkTS)
华为·音视频·harmonyos
小正太浩二13 小时前
视频去动态水印软件HitPaw安装和使用教程
音视频·视频无水印软件
骄傲的心别枯萎13 小时前
RV1126 NO.47:RV1126+OPENCV对视频流进行视频腐蚀操作
人工智能·opencv·计算机视觉·音视频·rv1126
骄傲的心别枯萎13 小时前
RV1126 NO.48:RV1126+OPENCV在视频中添加时间戳
人工智能·opencv·计算机视觉·音视频·视频编解码·rv1126
沉迷单车的追风少年13 小时前
Diffusion Models与视频超分(3): 解读当前最快和最强的开源模型FlashVSR
人工智能·深度学习·计算机视觉·aigc·音视频·视频生成·视频超分
CV实验室13 小时前
CV论文速递:覆盖视频理解与生成、跨模态与定位、医学与生物视觉、图像数据集等方向(11.03-11.07)
人工智能·计算机视觉·音视频
EasyGBS1 天前
智能安防新篇章:EasyGBS助力重塑物业视频管理服务
音视频
骄傲的心别枯萎1 天前
RV1126 NO.45:RV1126+OPENCV在视频中添加LOGO图像
人工智能·opencv·计算机视觉·音视频·rv1126
骄傲的心别枯萎1 天前
RV1126 NO.46:RV1126+OPENCV对视频流进行视频膨胀操作
人工智能·opencv·计算机视觉·音视频·rv1126
王道长服务器 | 亚马逊云1 天前
AWS + 发财CMS:高效采集站的新形态
服务器·网络·云计算·音视频·aws