【音频编解码】音频编码格式 G.722、G.722.1、G.722.1.C 的区别

这三种音频编码格式都属于 ITU-T G.7xx 系列标准，主要用于语音通信和会议系统，但它们在技术原理、带宽效率和音质上有显著区别。

简单来说，G.722 是基础宽带标准，G.722.1 是其高效压缩版，而 G.722.1 Annex C（常被称为 G.722.1.C）则是 G.722.1 的超宽带增强版。

下面为你详细解析它们的区别和联系。

为了让你一目了然，我们先通过一个表格对比它们的关键参数：

特性	G.722	G.722.1	G.722.1 Annex C (G.722.1.C)
采样率	16 kHz	16 kHz	32 kHz
音频带宽	50 Hz - 7 kHz (宽带)	50 Hz - 7 kHz (宽带)	50 Hz - 14 kHz (超宽带)
比特率	64 / 56 / 48 kbps	32 / 24 kbps	48 / 32 / 24 kbps
算法延迟	约 3 ms	40 ms	40 ms
核心技术	子带自适应差分脉冲编码调制 (SB-ADPCM)	变换域编码 (MLT)	变换域编码 (MLT)

G.722 是 ITU-T 在 1988 年制定的第一个用于 16kHz 采样率的标准化宽带语音编码算法。

技术原理 ：它采用子带自适应差分脉冲编码调制 (SB-ADPCM) 技术。简单说，就是将音频信号分成低频（0-4kHz）和高频（4-8kHz）两个子带，然后分别进行编码。由于人耳对低频更敏感，所以会分配更多比特给低频部分。
主要特点 ：
- 低延迟：算法延迟极低，仅约 3ms，非常适合实时通信。
- 免专利费：这是一个开放标准，无需支付专利费用，因此被广泛应用。
- 音质提升：相比传统的电话音质（G.711，带宽 300Hz-3.4kHz），G.722 的 50Hz-7kHz 带宽显著提升了语音的自然度和清晰度。

G.722.1 于 1999 年获批，其技术基础是 Polycom 公司的 Siren 7 算法。

核心目标：在保持与 G.722 相当音质的前提下，将比特率降低约一半。
技术原理 ：它放弃了 SB-ADPCM，转而采用基于调制重叠变换 (MLT) 的变换域编码技术。这种方法通过将信号从时域转换到频域，能更高效地进行压缩。
主要特点 ：
- 高压缩率：仅需 24 或 32 kbps 的比特率，大大节省了网络带宽。
- 低复杂度：算法复杂度较低，适合在资源受限的嵌入式系统上运行。
- 较高延迟：由于采用了帧处理，其算法延迟增加到 40ms。

G.722.1 Annex C 是在 2005 年批准的 G.722.1 的扩展，技术基础是 Polycom 的 Siren 14 算法。

核心升级 ：将采样率从 16kHz 提升到 32kHz ，从而将音频带宽扩展到了 14kHz，实现了"超宽带"（Superwideband）音频。
技术原理：与 G.722.1 类似，同样采用 MLT 变换域编码。
主要特点 ：
- 更高音质：14kHz 的带宽能捕捉更多人声细节和部分乐器声音，音质比 G.722 和 G.722.1 更出色。
- 灵活码率：支持 24, 32, 48 kbps 三种码率，可根据网络状况灵活选择。
- 自动识别：解码器能够自动识别编码时使用的码率，无需手动配置。

你可以将它们看作是音频编码技术在不同方向上的演进：G.722 追求低延迟和兼容性，G.722.1 追求带宽效率，而 G.722.1.C 则在效率和音质之间取得了更好的平衡。