一、为什么需要 Disruptor?------ 背景与问题
在高并发编程中,传统的队列(如 java.util.concurrent.ArrayBlockingQueue 或 LinkedBlockingQueue)在高性能场景下会成为瓶颈,主要问题在于:
- 锁竞争:生产者和消费者之间使用同一把锁(或读写锁),导致线程频繁挂起、唤醒,上下文切换开销巨大。
- 伪共享:多个线程修改的、逻辑上独立但物理上相邻的变量,会因 CPU 缓存行的同步而导致性能急剧下降。
- 内存分配开销:对于链表结构的队列,每次入队出队都可能涉及节点对象的创建和垃圾回收,在高吞吐下 GC 压力大。
- 低效的遍历:队列的"头出尾入"设计,使得遍历和批量操作不够高效。
Disruptor 的目标就是解决这些问题,实现极低延迟、超高吞吐的线程间数据交换。
二、核心设计思想
Disruptor 不是一个传统意义上的 FIFO 队列,而是一个 基于数组的环形缓冲区(Ring Buffer) 。它的核心设计思想可以概括为以下几点:
1. 环形数组结构:

- 使用一个固定大小的数组预先分配所有内存,避免运行时动态内存分配。
- 数组元素(
Event)在初始化时就全部创建好,并被重复使用。这消除了 GC 压力。 - 通过取模运算(实际是高效的位运算,要求数组大小为2的幂次)实现环形覆盖,指针无限递增,永不回收。
2. 无锁设计:
- 核心操作(生产与消费)完全无锁(Lock-Free) ,通过内存屏障(Memory Barrier) 和 CAS(Compare-And-Swap) 操作实现线程安全。
- 生产者之间通过 CAS 竞争下一个可写的槽位。
- 生产者和消费者之间通过序列(Sequence) 的协调来工作,消费者通过等待策略(Wait Strategy) 来感知新数据的到来。
3. 消除伪共享(Cache Line Padding) :
- 识别出会被多个线程频繁写入的关键变量(如生产者的
cursor,各个消费者的Sequence)。 - 通过在这些变量前后添加无意义的填充字节(
padding),确保每个核心变量独占一个完整的 CPU 缓存行(通常为64字节),防止它们被意外地加载到同一个缓存行中,从而避免一个线程的写入使另一个线程的整个缓存行失效。
4. 批量与依赖关系:
- 支持批量处理事件,能极大提高吞吐量。
- 可以显式地构建消费者之间的依赖关系图 (如
A->B->C或A,B 都完成 -> C),实现高效的工作流。
三、核心组件与原理
1. 环形缓冲区(Ring Buffer)
这是 Disruptor 的物理存储核心。它是一个固定大小的 Object[] 数组。每个位置被称为一个"槽"(slot)。
size:必须是2的幂次(如 1024)。这样sequence % size可以通过sequence & (size - 1)位运算高效完成。cursor:生产者发布事件的序列号。它代表最后成功发布的事件的位置。这是一个Sequence对象。- 缓冲区本身不维护"头"和"尾"指针,头和尾的概念由生产者和消费者的
Sequence共同决定。
2. 序列(Sequence)
Disruptor 的灵魂。它是一个使用 padding 封装的长整型(long)值。
-
所有需要追踪进度的组件都有自己的
Sequence:Ring Buffer有cursor(一个Sequence)。- 每个
EventProcessor(消费者)有自己的Sequence,表示自己已处理完成的位置。 - 每个
Producer(如果是多生产者)也有自己的Sequence。
-
Sequence的值单调递增,代表对应组件在环形缓冲区中的位置。 -
通过比较不同
Sequence的值,就能知道生产和消费的进度关系。
3. 序列屏障(Sequence Barrier)
消费者用来协调工作、控制进度的核心工具。
-
它持有:
- 生产者(或上游消费者)的
cursor引用。 - 所有它所依赖的消费者的
Sequence引用(用于构建依赖图)。
- 生产者(或上游消费者)的
-
当一个消费者想要消费事件时,它会询问它的
SequenceBarrier:"我可以安全消费的下一个事件是什么?" -
SequenceBarrier的逻辑是:返回min(生产者cursor, 所有依赖的消费者的Sequence)。这确保了消费者不会超越其依赖者,从而实现了无锁的有序消费。
4. 等待策略(Wait Strategy)
定义了消费者如何等待新事件的到来。这是影响延迟和 CPU 占用的关键。
BlockingWaitStrategy:使用锁和条件变量。最节省CPU,但延迟最高。适用于异步日志等场景。SleepingWaitStrategy:先自旋,后Thread.yield(),最后使用LockSupport.parkNanos(1)。平衡延迟和CPU。YieldingWaitStrategy:先自旋100次,然后调用Thread.yield()。延迟低,但会占用较多CPU。适用于要求极高吞吐、线程数小于CPU核心数的场景。BusySpinWaitStrategy:纯自旋。延迟最低,但疯狂消耗CPU。必须在绑定核心、线程数少于物理核心数的场景下使用。
5. 事件处理器(EventProcessor)
消费者的执行体。通常指 BatchEventProcessor。
-
它是一个线程,其
run()方法内部是一个循环:- 通过
SequenceBarrier.waitFor(nextSequence)等待自己可用的最大nextSequence。 - 获取到
availableSequence后,从自己的当前sequence到availableSequence批量处理事件。 - 调用
EventHandler.onEvent()处理每个事件。 - 处理完毕后,更新自己的消费者
Sequence值。
- 通过
6. 生产者(Producer)
负责向 Ring Buffer 发布事件。分为单生产者(Single Producer) 和多生产者(Multi Producer) 两种模式。
-
发布过程(两阶段提交) :
-
申请空间(Claim) :
- 单生产者:直接
nextSequence = cursor + 1(无竞争,无需CAS)。 - 多生产者:通过 CAS 操作竞争递增一个
nextSequence。
- 单生产者:直接
-
发布(Publish) :
- 生产者将数据写入
nextSequence对应的slot。 - 写入完成后,必须调用
RingBuffer.publish(sequence)。 publish方法会先添加内存屏障(store-store barrier,确保数据写入先于cursor更新),然后将cursor更新到sequence。cursor的更新会通知所有在SequenceBarrier上等待的消费者。
- 生产者将数据写入
-
四、工作流程示例(单生产者 -> 单消费者)
-
初始化:
- Ring Buffer 大小为 8,
cursor = -1。 - 消费者
Sequence = -1。
- Ring Buffer 大小为 8,
-
生产者发布事件:
- 生产者需要发布事件
A。它申请下一个位置:next = cursor + 1 = 0。 - 它将事件
A的数据写入RingBuffer[0 & 7],即RingBuffer[0]。 - 写入完成后,调用
publish(0),更新cursor = 0。
- 生产者需要发布事件
-
消费者消费事件:
- 消费者线程(
BatchEventProcessor)在循环中调用SequenceBarrier.waitFor(0)。 SequenceBarrier发现cursor (0) >= 0,且没有依赖者,于是返回availableSequence = 0。- 消费者知道自己当前的
sequence (-1) < availableSequence (0),于是处理RingBuffer[0]的事件A。 - 处理完成后,将自己的
Sequence更新为0。
- 消费者线程(
-
循环继续 :生产者发布事件
B到slot 1,更新cursor=1。消费者等待并处理,如此往复。
五、多消费者与依赖关系
这是 Disruptor 最强大的部分。例如,我们有三个消费者:C1(数据持久化),C2(数据统计),C3(发送消息,必须在 C1 和 C2 都完成后进行)。
-
构建依赖图:
rustRingBuffer -> C1 -> C2 -> C3 (依赖 C1 和 C2) -
C3的SequenceBarrier会持有RingBuffer.cursor、C1.sequence和C2.sequence。 -
当
C3调用waitFor时,SequenceBarrier返回的是min(生产者cursor, C1.sequence, C2.sequence)。 -
这意味着,即使生产者已经发布了事件
10,但只要C1才处理到5,C3最多也只能拿到5。这样就保证了C3不会跑到C1前面去,完全无锁地实现了依赖。
六、总结:Disruptor 高性能的秘诀
- 预分配内存,消除GC:环形数组 + 对象复用。
- 无锁并发:CAS + 内存屏障,取代重量级锁。
- 消除伪共享:对关键序列进行缓存行填充。
- 批量处理:一次等待,处理多个事件,摊薄开销。
- 依赖关系感知:通过序列比较实现无锁的消费者协调,避免了"线程间握手"的开销。
- 关注点分离:将并发控制(Sequence, Barrier)、等待逻辑(WaitStrategy)、业务处理(EventHandler)清晰地解耦。
Disruptor 本质上是一种精心设计的内存队列,它将共享变量的数量降到最低(核心就是那几个 Sequence),并通过硬件友好的方式(缓存行填充、内存屏障)来操作它们,从而在软件层面最大限度地压榨出现代 CPU 和内存子系统的性能。它特别适用于金融交易、高频计算、事件溯源等对延迟和吞吐有极端要求的领域。