组件和框架的初始化顺序背后可能隐藏着线上故障?

一个微服务可能引入非常多的SDK,例如消息中间件kafka的组件、RPC框架dubbo、定时任务调度平台xxl-job的组件,以及提供web服务的jetty/tomcat等。

你有注意过这些组件或框架的启动顺序吗?

说起Java的微服务开发,肯定离不开Spring Boot。而我们所使用的组件,都会通过Spring Boot提供的AutoConfiguration机制完成自动初始化。或者是我们自己封装的通过AutoConfiguration机制实现的初始化。

Spring Boot虽然提供Ordered机制实现排序,但如果都是开源的组件,背后不是同一个组件,那么大概率就是默认的要么最高、要么最低排序值。实际就是没有顺序。

当某个组件或框架初始化故障会发生什么?

假如rpc提供者先初始化注册到了zk,就会开始接收rpc消费者过来的流量,但是提供者处理逻辑需要发kafka消息,但是kafka如果初始化失败了,那么这批流量就会有问题。

假如xxl先初始化注册了,Job调度到这个节点执行,而执行逻辑依赖kafka,如果kafka生产者初始化失败,那么这次调度就会失败。假如jetty/tomcat先启动,就会开始接收用户流量,如果接着初始化其它以来的组件失败了,那么这些已经接收的用户流量就无法被正常处理。因此,如果发生组件初始化失败,就会出现流量处理异常,即服务不平滑上线,最终触发告警。

反方向也是一样的, Shutdown如果没有顺序的话,也可能会出现服务不平滑下线。例如,kafka组件先一步处理Shutdown信号,那么如果此时rpc接收到流量,需要依赖kafka处理逻辑,就会出现问题。

怎么定这些组件或框架的初始化顺序?

一般kafka的消费者和提供者是分开初始化的、rpc的消费者和提供者也是分开初始化的。

那么有没有一个顺序,能够避免上面所有假设的事件出现。

kafka生产者->rpc消费者->xxl->kafka订阅者->rpc提供者->jetty/tomcat

其中kafka生产者->rpc消费者这一段,kafka生产者和rpc消费者的顺序不分先后。

xxl->kafka订阅者->rpc提供者->jetty/tomcat,这一段,顺序也不分先后。

但是kafka生产者->rpc消费者必须先于xxl->kafka订阅者->rpc提供者->jetty/tomcat

因为xxl、kafka订阅者、rpc提供者、jetty/tomcat都是流量的入口。而kafka生产者、rpc消费者是流量的出口。

因此,只要出口先于入口初始化完成,基本就没什么问题。对于Shutdown,只要入口先于出口关闭,也不会有问题。

怎么指定顺序,指定顺序就能解决问题吗?

实际上,以上的假设成立的前提条件是,rpc消费者代理实例、kafka生产者实例这些【流量出口】都是用到的时候再创建的,或者说创建的时候内部初始化逻辑出错没有给外部抛异常,比如懒初始化,异步建连等。kafka提供者和zookeeper组件就是这样的逻辑。

如果初始化是同步的,并且发生错误会抛出异常,那么假设就不会成立。因为在Spring Boot框架之上开发,基本都是自动注入bean,而xxl的job也好,rpc提供者也好,kafka的消费者也好,都是通过依赖注入注入一个rpc消费者代理实例或者kafka生产者实例,而Spring Boot就已经保证了在注入之前肯定会先创建依赖的bean。

但是,KafkaProducer的内部初始化(与kafka服务端创建连接)是不在主线程上的,假如kafka服务端挂掉了,或者网络不通,这时候是不会抛异常的,只有在发消息的时候,才能得知异常。又或者topic忘记创建。我们没办法改变这种内部逻辑,也无法通过指定组件初始化顺序解决这个问题:Zookeeper的话,我们可以通过阻塞等待创建连接完成,但KafkaProducer无法做到。

另外,Shutdown的逻辑也是无顺序的,如果都是各自注册ShutdownHook。但如果是需要显示调用Close,我们就可以自己完成所有组件和框架的Shutdown逻辑和编排顺序。

相关推荐
oLLI PILO2 分钟前
Ubuntu介绍、与centos的区别、基于VMware安装Ubuntu Server 22.04、配置远程连接、安装jdk+Tomcat
java·ubuntu·centos
de_wizard4 分钟前
Spring Boot 整合 Apollo 配置中心实战
java·spring boot·后端
用户6757049885024 分钟前
AI开发实战1、手摸手教你一行代码不写,全程AI写个小程序——前端布局
后端·aigc·ai编程
JAVA学习通5 分钟前
AI Agent 工具调用机制深度解析与 Spring Boot 工程集成实战(2026版)
java·人工智能·spring boot·python·spring
ooseabiscuit5 分钟前
Spring报错解决一览
java·后端·spring
未秃头的程序猿7 分钟前
从“拆东墙补西墙”到“最终一致”:分布式事务在Spring Boot/Cloud中的破局之道
分布式·后端·spring cloud
Java编程爱好者7 分钟前
Java高级面试必问:AQS 到底是什么?
后端
Foreer黑爷7 分钟前
Java多线程编程:Thread与Runnable的并发控制
java·开发语言
身如柳絮随风扬10 分钟前
深入理解 Sentinel:服务雪崩、熔断原理、使用实践与规则持久化
java·微服务·sentinel
dgvri10 分钟前
Spring Boot接收参数的19种方式
java·spring boot·后端