音频原始数据PCM

PCM全称是脉冲编码调制数据。PCM数据是未经过压的音频数据,它由模拟信号信号经过采样、编码等步骤抓换成的数字信号。

一、音频基础知识讲解

1.1频率

声音是由震动产生的,所以声音是有频率的,人类可以听到的声音频率大概在20HZ~20KHZ

1.2振幅

振幅指的就是声音的响度,也就是常说的音量

1.3比特率

代表的是音频没有经过任何的压缩每秒可以传输的数据量

比特率 = 采样率 * 采样深度 * 通道数

1.4采样

采样就是把一段连续的模拟信号转换成离散的数字信号。采样率就是每秒采集的次数,当采样率大于等于连续信号的两倍时,采样信号就可以无差别的还原出原始的数据。比方说人类的听觉频率是20-20KHZ,采样率就必须达到40KHZ以上才可以保证数据的完整性。

1.5量化

量化指的是在坐标轴上,把每一个离散的数据进行数字化操作,就是把采样后的每一个点都按数字化的方式表示出来。如下图:

1.6编码

编码就是把量化后采样点的每一个值存储起来,并且使用二进制的方式表示出来。

把这个表中的所有二进制数存储起来,就是一段连续的PCM数据。

对于一个音频的原始数字信号的生成:

采样-->量化-->编码-->PCM数据

二、PCM的重要参数

(1)采样率:指的是每秒采样的次数,48000HZ就相当于每秒采集48000次

PCM常见的采用率:

192000KZ:192KHZ(蓝光、高清电影DVD)

96000HZ:96KHZ(蓝光、高清电影DVD)

48000HZ: 48KHZ(数字电视、DVD)

44100HZ:44.1KHZ(CD音质)

22000HZ: 22KHZ (无线广播)

(2)采样深度:每次采样的数据大小,采样深度代表取样中对声音强度记录的精细程度,采样深度和采样率共同决定了声音的还原度。

在PCM常见的三种采样深度:8bit 16bit 32bit(FLTP)

(3)通道数

PCM一般有四种通道:单声道、双声道、四声道、5.1声道

单声道:只有一个声音的通道,比如喇叭、电话

双声道(立体声):有两个声音通道, 声音在录制的过程中分配到两个独立的声道,这让人听起来就有了立体的感觉。

四声道:前后左右四个发声通道,人听起来就像和被声音包围起来一样。

5.1声道:一般用于家庭影院,实际开发很少用到

(4)PCM比特率:只是一秒传输的bit数

PCM比特率 = 采样率 * 采样深度 *声道数

(5)PCM文件大小计算:PCM比特率 * 时长/8 单位是字节

三、PCM的文件存储格式

上图是PCM的单双声道存储布局,对于双声道有两种存储方式,一种交错模式,另外一种是非交错模式。

交错模式:先记录一帧左声道的样本,然后记录一帧又声道的样本,以此反复

非交错模式:先记录一个周期内所有帧的左声道样本,再记录所有右声道样本

相关推荐
我是发哥哈7 小时前
主流AI视频生成方案商用化能力横向评测
大数据·人工智能·学习·机器学习·chatgpt·音视频
reasonsummer8 小时前
【教学类-160-10】20260418 AI视频培训-练习011“豆包AI视频《毛毛虫找妈妈》+豆包图片风格:水墨画”
音视频·豆包图片
liulian091610 小时前
【Flutter for OpenHarmony第三方库】Flutter for OpenHarmony 音频播放功能适配与实现指南
flutter·华为·音视频·学习方法·harmonyos
互联科技报11 小时前
2026年短视频矩阵视频混剪软件工具商业分析报告
线性代数·矩阵·音视频
philsonzhao11 小时前
ffmpeg如何剪辑视频,并保留字幕
音视频
byte轻骑兵11 小时前
【LE Audio】BASS精讲[3]: 从服务声明到行为逻辑 解锁广播音频接收核心
音视频·实时音视频·le audio·低功耗音频·蓝牙通话
ai产品老杨12 小时前
深度解析:基于异构计算的工业级AI视频中台架构,如何实现GB28181/RTSP跨平台部署与源码交付?
人工智能·架构·音视频
枫叶丹413 小时前
【HarmonyOS 6.0】AVCodec Kit 视频解码器平滑停用机制详解
开发语言·华为·音视频·harmonyos
ai产品老杨13 小时前
告别重复造轮子:深度解析支持源码交付的 AI 视频平台架构,实现 X86/ARM 与 GPU/NPU 异构算力融合
人工智能·架构·音视频
ai产品老杨14 小时前
【深度架构解析】高并发 AI 视频管理平台:兼容 GB28181/RTSP,支持 X86/ARM+GPU/NPU 异构部署与源码交付
人工智能·架构·音视频