P4 音频知识点——PCM音频原始数据

目录

前言

[01 PCM音频原始数据](#01 PCM音频原始数据)

[1.1 频率](#1.1 频率)

[1.2 振幅:](#1.2 振幅:)

[1.3 比特率](#1.3 比特率)

[1.4 采样](#1.4 采样)

[1.5 量化](#1.5 量化)

[1.6 编码](#1.6 编码)

[02. PCM数据有以下重要的参数:](#02. PCM数据有以下重要的参数:)

采样率:

采集深度

通道数

​​​​​​​ PCM比特率

​​​​​​​ PCM文件大小计算:

​​​​​​​ PCM存储格式​​​​​​​


前言

从本章开始我们将要学习嵌入式音视频的学习了 ,使用的瑞芯微的开发板

🎬 个人主页:@ChenPi

🐻推荐专栏1: 《C++_@ChenPi的博客-CSDN博客》✨✨✨

🔥 推荐专栏2: 《Linux C应用编程(概念类)_@ChenPi的博客-CSDN博客》✨✨✨

🛸推荐专栏3:《嵌入式音视频_@ChenPi的博客-CSDN博客

🌺本篇简介 :这章记录音频的基础知识学习

01 PCM 音频原始数据

音频原始数据PCM,PCM全称是脉冲编码调制数据。PCM数据是未经过压缩的音频数据,它是由模拟信号经过采样、编码等步骤转换成标准的数字信号。

1.1 频率

频率:声音的频率,我们人类的所听到的声音频率范围大概在20hz-20khz

1.2 振幅:

振幅:指的是声音的响度,也就是我们常说的高低音

1.3 比特率

****比特率:****代表的是音频未经过压缩的数据,每秒需要传输的数据量,它的公式是:

采样率*采样深度*通道数

1.4 采样

采样:采样是我们音频最重要的知识点之一,它指的是把一段连续的模拟信号转换成离散的数字信号。而采样率就指的是每秒钟采样的个数,而根据奈奎斯特采样公式:****当采样率大于等于连续信号的2倍时,采样信号就能够无差别还原出原始的信号。****比方说人类的听觉频率是20HZ-20KHZ,而采样率就需要达到40KHZ以上才能够保证数据的完整性。

1.5 量化

量化:量化指的是在坐标轴上,把每一个离散数据进行数字化操作。换言之就是把我们每一个采样的点都按照数字化表示出来,如下图

从这张图我们可以看出,量化的过程就是把刚才我们转换成的数字信号一个一个点用竖线显示出来,这样的话我们在数字化的时候就方便很多。

1.6 编码

编码:把每一个量化的采样点存储起来,并以二进制的形式表现出来的过程就是编码。下图就是存储的表格:

把上图所有的数据存储起来,就是一段连续的PCM数据。

PCM数据,二进制形式:

011011110111101......

对于一个音频的原始数字信号的生成:

采集->采样->量化->编码:->PCM数据

02. P CM 数据有以下重要的参数

采样率:

​​​​​​​ ****采样率:****指的是每秒钟采样的个数,换言之就是1S钟采集声音的频率,比方说48000HZ就相当于一秒钟PCM采集48000个。PCM数据常用的采样率有:

  1. 192000HZ :1 92KHZ(蓝光、高清电影DVD)
  2. 96000HZ 96KHZ(蓝光、高清电影DVD)
  3. 48000HZ 48KHZ(数字电视、DVD) (最常用)
  4. 44100HZ :4 4.1KHZ(CD音质)
  5. 22000HZ :2 2KHZ(无线广播)

采集深度

采样深度:每次采样的大小,比方说如果采样深度是 16BIT

那声音就有2的1 6 次方的振幅,而 32 bit就相当于有2的3 2 次方个振幅。

声音振幅越多,声音的质量就会越高。

在PCM中,有三种常见的采样大小:

8 BIT1 6BIT3 2BIT ( FLTP)

​​​​​​​ 通道数

PCM一般有四种通道数:

单声道:

指的是只有一个声音的通道,比方说电话、喇叭之类的

双声道(立体声 )

双声道指的是有两个声音的通道,声音在录制的过程中分配到两个独立的声道,这让人听起来就有立体的感觉。

四声道:

四声道指的是前左、前右、后左、后右四个发声通道。观众听起来,则像被声音包围了一样。

声道:

5.1声道广泛运用在家庭影院

​​​​​​​ P CM 比特率

比特率指的是每秒传输的比特数(bit),一般PCM的比特率计算公式是:

采样率*采样深度*通道数

比如:48000 * 16 * 2 = 1536000

​​​​​​​ P CM 文件大小计算:

假设一个PCM音频设备采样率48000、采样精度是16bit、2通道,大概采集10分钟数据,那它的大小:采样率 * 采样深度 * 通道数 * 时长 = 48000 * 16 * 2 * 10 * 60 = 921600000bit,然后再把bit转换成字节(BYTE) 921 600 000/8/1024/1024 = 109M

​​​​​​​ PCM 存储格式

上图是PCM单双声道的存储布局,这里我们来重点讲解一下双声道的布局。

一般双声道的存储有两种存储方式,一种是交错模式、另外一种是非交错模式。

  • 交错模式:首先记录第一帧的左声道样本和右声道样本
  • 非交错模式:首先先记录一个周期内所有帧的左声道样本、再记录所有右声道样本

交错模式:L R L R L R L R

非交错模式:L L L L L R R R

此篇文章来源于B站博主------飞一样的成长

相关推荐
vip4515 分钟前
Linux 经典面试八股文
linux
大霞上仙8 分钟前
Ubuntu系统电脑没有WiFi适配器
linux·运维·电脑
艾派森8 分钟前
大数据分析案例-基于随机森林算法的智能手机价格预测模型
人工智能·python·随机森林·机器学习·数据挖掘
hairenjing112310 分钟前
在 Android 手机上从SD 卡恢复数据的 6 个有效应用程序
android·人工智能·windows·macos·智能手机
小蜗子14 分钟前
Multi‐modal knowledge graph inference via media convergenceand logic rule
人工智能·知识图谱
SpikeKing27 分钟前
LLM - 使用 LLaMA-Factory 微调大模型 环境配置与训练推理 教程 (1)
人工智能·llm·大语言模型·llama·环境配置·llamafactory·训练框架
黄焖鸡能干四碗1 小时前
信息化运维方案,实施方案,开发方案,信息中心安全运维资料(软件资料word)
大数据·人工智能·软件需求·设计规范·规格说明书
1 小时前
开源竞争-数据驱动成长-11/05-大专生的思考
人工智能·笔记·学习·算法·机器学习
ctrey_1 小时前
2024-11-4 学习人工智能的Day21 openCV(3)
人工智能·opencv·学习
~yY…s<#>1 小时前
【刷题17】最小栈、栈的压入弹出、逆波兰表达式
c语言·数据结构·c++·算法·leetcode