liwen01 2026.02.21
前言
现如今,蓝牙耳机的普及率非常高,蓝牙耳机的品类品牌也非常多。蓝牙耳机的价格和使用体验逐渐被大众所接受。
用户的大部分需求是:无损音质、超低延迟、连接稳定、佩戴舒适 。
然而,蓝牙标准在设计之初就受限于 2.4GHz 频段的带宽及低功耗的限制,使得蓝牙耳机必须在一套极其精密的协议栈逻辑下运行。

蓝牙耳机的发展,一直是在带宽、功耗、延迟之间做取舍。
(一)蓝牙音频协议栈
蓝牙音频并不是由单一协议构成的,它有一套紧密协作的协议族。为了实现音频的稳定传输和远程控制,蓝牙协议栈架构设计了多个层次。

总体而言可以分为两个通道:
- 音频流通道 :
A2DP -> GAVDP -> AVDTP -> L2CAP - 控制指令通道 :
AVRCP -> AVCTP -> L2CAP
A2DP 负责 听 ,AVRCP 负责 控 ,AVDTP 和 AVCTP 则分别是它们在底层的 腿。
这么设计的目的是为了控制命令不会因为音频传输通道的阻塞而受影响。
(1) 核心协议及其作用
(A)A2DP (Advanced Audio Distribution Profile) :
早期的蓝牙主要用于通话(HSP/HFP),音质极差。A2DP 的出现是为了打破这种局限,支持高比特率的音乐流。
A2DP 的作用是:定义如何将高品质音频(立体声或单声道)通过 ACL 链路分发到另一个蓝牙设备。
(B)GAVDP (Generic Audio/Video Distribution Profile)
GAVDP 的设计初衷是 为不同的音视频应用提供通用的信令框架,避免重复造轮子。
GAVDP的作用是:作为 A2DP 的基础,它定义了音视频分发的基本流程(如流的建立、开始、暂停)
(C)AVDTP (Audio/Video Distribution Transport Protocol)
AVDTP 的设计目的 是解决音频数据在传输过程中的分片、重组及流控问题。主要作用是数据搬运工。
AVDTP定义了音视频流在 L2CAP 层之上的传输协议,负责媒体流的打包、拆包及协商功能。
(D)AVCTP (Audio/Video Control Transport Protocol)
AVCTP 的设计目的是:确保控制指令(如播放/暂停)能与数据流分开传输,互不干扰。作用是为控制指令提供传输通道。
(E)AVRCP (Audio/Video Remote Control Profile)
AVRCP 设计的目的 是让用户可以通过耳机直接操作手机上的播放器,实现交互闭环。
AVRCP的作用是遥控器,实现切歌、音量调节、获取歌名、同步播放状态等功能。
(二)音频传输流程
你手机里的一首 MP3 音乐,从你在播放器中点击播放,到声音传输到你耳膜,这中间都经历了些什么?

手机播放器需要先将 MP3 解码成 PCM 音频格式,然后再重新编码成可以进行蓝牙传输的音频格式,最后再通过蓝牙模块将声音发送出去。
耳机端在接收到编码后的音频之后,先需要进行解码,然后再将它播放出来。
(1)第一阶段:手机端的套娃编码
手机里的MP3音频文件格式,并不能直接用来做蓝牙传输,那为什么不能直接传输 MP3 数据呢?
主要有3个:
- (a)手机等系统需要混音(比如播放音乐过程中有微信消息)
- (b)版权许可和硬件解码能力的限制,A2DP 协议很少支持mp3协议
- (c)MP3 通常是固定码率,但蓝牙链路的带宽会随干扰而波动。
实际应用中,手机端需要将MP3格式解压为PCM(原始采样数据)格式,然后再重新编码成能够支持蓝牙传输的压缩方式,比如:SBC、AAC、aptX 或 LDAC。
这中间,如果 PCM 音频文件的采样率与蓝牙协议协商的采样率不一致,还需要进行重采样,比如 48kHz 转 44.1kHz。
这里 MP3 文件原本就是有损压缩的,解码之后再重新编码,音质会进一步下降。
(2)第二阶段:协议栈的打包封发
首先是 AVDTP 将编码后的音频帧加上 RTP 头(包含序列号和时间戳),确保耳机端能按序还原。
其次是 L2CAP 将大的数据包切割为适应底层的微小数据包。
最后再通过蓝牙的射频模块,通过跳频技术,将数字信号调制为 2.4GHz 射频波发送出去。
(3)第三阶段:耳机端的解构与还原
耳机接收到包后不会立即播放,而是先存入 Buffer,以应对无线环境波动带来的数据包到达时间不均问题,实现 抖动缓冲 的作用。
然后耳机的 SOC 芯片调用硬解码器将 SBC/AAC 音频包解码还原回 PCM 格式音频。
最后 PCM 音频经过数模转换器(DAC)变为模拟电信号,再通过放大器驱动振膜发声传输到人的耳朵里。
(三)蓝牙耳机的延迟

从上面 MP3 数据传输过程我们可以知道,一首音乐,需要先解码,再重新编码才能将数据发送出去。
蓝牙耳机端接收到编码后的音频数据后,还需要再度进行解码才能播放。
解码->编码->解码->播放 这个过程的时间延迟无法避免。
另外,软件协议栈上,在收发数据的时候,都需要做抖动缓存,这里也会有明显的耗时。
对于专业游戏玩家来说,是会有明显延迟的感觉。所以我们基本上看不到专业游戏玩家使用无线蓝牙耳机来打比赛。
(四)蓝牙耳机的声音失真
蓝牙传输的带宽有限,为了尽量保证声音的不失真,就需要在高码率(高质量音频)与无线传输稳定性之间做选择。
码率越高,音质就会越好,但传输距离就会变短、抗干扰能力也会变弱。。
(1)蓝牙音频编码分类
我们现有蓝牙支持的编码格式有:
| 编解码器 | 最大码率 (kbps) | 音质表现 | 延迟 | 主要阵营 |
|---|---|---|---|---|
| SBC | ~328 | 一般 | 高 | 全球通用 |
| AAC | ~250 | 优秀 | 中等 | Apple 用户首选 |
| aptX Adaptive | ~420-600 | 极佳 | 极低 | Android/高通机型 |
| LDAC | 990 | 顶级 | 中等 | Sony/高端 Android |
| LHDC | 1000+ | 顶级 | 低 | 国产旗舰机型 |
| aptX Lossless | 1200 | 无损 | 低 | 2025-2026 旗舰级 |
(2)SBC (Subband Coding)
SBC 是蓝牙协议(A2DP)强制规定 的基准格式,所有蓝牙耳机必须支持。
它主要应用于 最基本的音频需求(如播客、短视频)、廉价蓝牙耳机、或设备间无法识别高级编码时的保底方案
它的优点就是:兼容性好,可以做到100%兼容,连接也非常稳定。
缺点是:压缩率高,高频细节损失严重,延迟较高(通常 >200ms)
(3)AAC (Advanced Audio Coding)
AAC 是苹果生态系统的核心编码,也是主流流媒体(如 Apple Music、YouTube)的常用格式,它是 iPhone 用户的首选编码格式。
优点是: 压缩算法比 SBC 更先进,同码率下音质更好;在 iPhone 上表现极佳,延迟相对可控。
缺点是:在部分 Android 手机上由于系统算法问题,表现可能不如 SBC 稳定。
(4)Qualcomm aptX 系列
Qualcomm aptX 系列是由高通主导,主要应用于搭载高通芯片的 Android 手机和耳机中。
aptX / aptX HD :旨在提供接近 CD 级的听感。HD 版本支持最高 24-bit/48kHz,音质优于 SBC/AAC,传输更高效,声音细节更丰富。
缺点就是需要发射端(手机)和接收端(耳机)都使用高通芯片,苹果设备完全不支持。
aptX Adaptive / aptX Low Latency (LL): Adaptive 是目前最先进的版本,能根据环境干扰自动切换音质或低延迟模式,解决了音质 与延迟的矛盾,延迟可低至 50ms-80ms。
(5)LDAC & LHDC
这类格式是专为追求无线 Hi-Res音质的烧友设计的。
LDAC (Sony 开发) 传输速率最高可达 990kbps,是 SBC 的 3 倍,可以尽可能地还原无损音乐的听感。
但是它对信号环境要求极高,干扰多时容易断连或卡顿,另外耳机续航会显著下降。
LHDC (Savitech 开发) 类似于 LDAC 的国产格式(如小米、OPPO、华为常用),同样支持高采样率和高码率,延迟表现通常优于 LDAC。
但是LHDC品牌适配度较窄,非相关品牌手机可能无法兼容。
结尾
深究下去会发现,蓝牙音频传输是一个复杂的系统工程。A2DP 和 AVDTP 构建了音频的高速公路 , AVRCP 则是红绿灯 和方向盘。
从 MP3 到 PCM 再到蓝牙编码的转换过程,虽然带来了延迟和一定的音质损失,但也可以满足大部分用户的使用需求。
LE Audio 和 LC3 编码器的到来,未来的无线音频将向更低延迟、更高保真度的方向持续演进。