音频中的PDM、PCM概念解读

PDM 是 Pulse Density Modulation 的缩写,中文译为"脉冲密度调制"。

它是一种用于表示模拟信号(如声音)的数字编码方法。


核心概念:用"密度"表示"大小"

您可以这样理解PDM:

  • 它使用一串单一的比特流(只有 0 和 1)来表示音频信号。
  • 1 的"密度"越高 (即在一段时间内 1 出现的次数越多),代表模拟信号的幅度越高
  • 1 的"密度"越低 ,代表模拟信号的幅度越低

下图直观地展示了模拟信号、PDM 信号及另一种常见数字音频格式 PCM 信号之间的关系,帮助您理解脉冲密度如何对应音频幅度:

复制代码
xychart-beta
    title "模拟信号、PDM 与 PCM 关系示意图"
    x-axis "时间轴" [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16]
    y-axis "幅度" 0 --> 5
    line [3.0, 3.3, 3.6, 4.2, 4.7, 4.5, 3.8, 3.0, 2.2, 1.5, 1.8, 2.3, 2.9, 3.5, 3.8, 4.0]
    bar [0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1]
    line [3.0, 3.0, 4.0, 4.0, 5.0, 5.0, 4.0, 3.0, 2.0, 2.0, 2.0, 2.0, 3.0, 4.0, 4.0, 4.0]
  • 模拟信号(平滑曲线):原始的连续声音波形。
  • PDM 信号(蓝色条形图) :每个时间单位一个脉冲(比特)。脉冲的密度(连续出现"1"的次数) 对应模拟信号幅度的高低。例如,在采样点 3-7 期间,脉冲密集,对应高幅度;在采样点 9-12 期间,脉冲稀疏,对应低幅度。
  • PCM 信号(橙色阶梯线):每个采样点用一个具体的数字值来表示幅度。例如,在采样点 5 的值为 5。

PDM 在音频领域的应用场景

您最常遇到 PDM 的地方是:

  1. 数字麦克风(Digital MEMS Microphones)

    这是PDM最主要的应用。手机、笔记本电脑、智能音箱、耳机等设备中内置的麦克风,很多都是PDM麦克风。

    • 工作原理:麦克风内部的MEMS传感器直接产生PDM信号。
    • 优势:麦克风本身完成了模数转换(ADC),直接输出数字信号。这使得它抗干扰能力更强,非常适合在电路板内部布线复杂、易受干扰的紧凑型设备中使用。
  2. 简单的音频接口

    PDM是一种非常简单的数字音频流,通常只需要一根数据线一根时钟线(称为 PDM CLK)即可传输单声道音频。如果要传输立体声(两个麦克风),通常会在同一对时钟和数据线上交替传输两个通道的数据。


PDM 与 PCM 的区别(非常重要!)

您可能更常听到的是 PCM(Pulse Code Modulation,脉冲编码调制),它是WAV文件、CD唱片以及几乎所有数字音频处理的基础格式。

特性 PDM (脉冲密度调制) PCM (脉冲编码调制)
信号形式 1-bit 的比特流,用密度表示幅度。 多-bit 的采样值(如16bit, 24bit),每个采样点是一个具体的数字值。
直观比喻 "用每秒喷水的次数来表示水压大小"
所需线路 非常简单(1时钟 + 1数据线) 更复杂(需要数据、时钟、帧同步等,如I2S接口)
处理方式 未经处理的原始数字流 已经量化的、可供直接处理或播放的音频数据
常见应用 数字麦克风(传感器端) 音频编解码、文件存储、DAC播放(处理与播放端)

关键总结:

  • PDM 是数字麦克风的"母语"。它是在传感器端产生的原始数字信号格式。
  • 音频接口(如主处理器、DSP、编码芯片)在接收到PDM信号后,通常会通过一个称为 "PDM转PCM转换器""抽取滤波器(Decimator)" 的模块,将其转换为标准的PCM格式,然后才能进行进一步的处理、编码或播放。
  • 所以,简单来说:PDM是"源头"的格式,而PCM是"通用"的格式。 音频系统需要将PDM转换为PCM才能使用。
相关推荐
REDcker5 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo19985 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君5 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥5 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_416276425 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk5 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS5 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_416276425 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_4582838686 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川6 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频