kafka的源码阅读起来思路很清晰,命名也很规范。
KafkaProducer值得学习的地方:
- Kafka的网络部分的设计绝对是一个亮点,Kafka基于NIO封装了一套自己的网络架构,支持一个客户端与多个Broker建立连接。
- 处理拆包和粘包的思路和代码,绝对是教科书级别的,大家可以把代码复制粘贴下来直接用到自己的线上项目去。
- RecordAccumulator封装消息的batchs,使用的自己封装的数据结构CopyOnWriteMap,采用读写分离的思想,用来面对高并发的场景(读多、写少),提升整个流程的性能。
- 封装消息的时候时候涉及的内存缓冲池,这极大地减少了GC的次数。(我们java项目,最怕最怕的就是GC,java项目60%的问题都是GC引起的)
- RecordAccumulator封装批次采用的是分段加锁思想,极大地提高了性能,看得出来作者确实编程功底很深厚。可以不用加锁的地方就不加锁,只在必须加锁的地方加锁。尽可能地去提升代码的性能,或者说是减少锁的使用。因为一旦使用锁,就可能出现死锁或者锁竞争。
- kafka的异常体系也是设计得比较清晰,在核心流程捕获异常,底层抛异常。
- 生产者去发送数据的时候,提供了两个方案:1)同步发送,性能会差 2)异步发送,里面结合回调函数,很大地提升了kafka的性能。
我们自己去设计一个系统的时候,可以借鉴以上思路。
from 洱海老师