Spring Boot 启动优化实践

写在文章开头

你是否遇到过这样的场景？灰度发布时，服务启动慢导致滚动更新时间过长；本地开发调试，每次重启都要等待漫长的时间。随着业务迭代和组件增多，Spring Boot 启动速度逐渐成为开发效率和上线效率的瓶颈。

面对启动慢的问题，借助系统化的方法论与 AI 工具的协同，我们可以快速定位瓶颈并实施优化。以笔者近期为例，一个 Spring Boot 启动优化的任务，原本评估需要 2 天，实际不到半天就完成了。

本着对解决方案的梳理和复盘，笔者创建了一个 demo 工程并以此文进行详细演示。本文将介绍：

如何通过 Spring 扩展点机制精准定位启动瓶颈
Druid 多数据源异步初始化优化方案
缓存预热异步化实践

最终将服务启动时间从 1 分钟优化至 13 秒。适合有一定 Spring 基础、希望提升服务启动效率的开发者阅读，预计阅读时长 8 分钟。

Spring Boot 启动优化实战：借助 AI 快速定位瓶颈

背景说明

随着业务迭代和组件增多，Spring Boot 启动速度逐渐变慢。每次灰度发布，滚动更新时间被拉长；本地开发调试，重启等待也让人头疼。于是我们对服务启动流程进行分析和优化。

启动流程分析

针对Spring系的Java程序而言，从底层原理来分析，启动环节耗时的核心在于依赖注入环节。从解决收益来看，优化 Spring Bean 的加载效果最为直观。

结合 Spring Boot 源码，我们定位到 run() 方法的核心流程：

环境准备 → 配置加载
打印 Banner → 个性化展示
创建上下文 → BeanFactory 初始化
上下文刷新 → Bean 实例化与依赖注入（重点）
后置 Runner → 扩展点执行

java 复制代码

public ConfigurableApplicationContext run(String... args) {
    //......
    try {
        ApplicationArguments applicationArguments = new DefaultApplicationArguments(args);
        //环境准备
        ConfigurableEnvironment environment = prepareEnvironment(listeners, bootstrapContext, applicationArguments);
        configureIgnoreBeanInfo(environment);
        //打印banner
        Banner printedBanner = printBanner(environment);
        //创建上下文
        context = createApplicationContext();
        context.setApplicationStartup(this.applicationStartup);
        //容器初始化
        prepareContext(bootstrapContext, context, environment, listeners, applicationArguments, printedBanner);
        //上下文刷新(涉及IOC操作)
        refreshContext(context);
        //......
        afterRefresh(context, applicationArguments);
        //......
        //调用后置runner拓展点
        callRunners(context, applicationArguments);
    }
    catch (Throwable ex) {
        //......
    }
    //......
    return context;
}

第一步：利用 Spring 扩展点定位耗时阶段

仔细观察源码发现，Spring Boot 核心方法调用都伴随事件发布。这是典型的监听者模式设计，即 Spring 暴露给开发者的定制化拓展点。结合个人经验，我将相关接口定义提交给 AI，让其完成启动耗时追踪代码的实现：

于是我们得到了这样一段代码，它清晰地将 run() 方法的核心流程进行耗时统计：

SpringApplicationRunListener 是 Spring Boot 提供的扩展接口，能够监听应用启动的各个阶段。我们可以实现这个接口，在每个阶段结束时记录耗时，从而定位启动瓶颈。

重要说明 ：SpringApplicationRunListener 需要通过 SPI 机制注册才能生效。在 src/main/resources/META-INF/spring.factories 文件中添加如下配置：

properties 复制代码

org.springframework.boot.SpringApplicationRunListener=\
com.example.qoderspringoptimizer.listener.MySpringApplicationRunListener

这样 Spring Boot 启动时才会通过 SPI 机制自动加载并调用我们的监听器。

java 复制代码

import lombok.extern.slf4j.Slf4j;
import org.springframework.boot.ConfigurableBootstrapContext;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.SpringApplicationRunListener;
import org.springframework.context.ConfigurableApplicationContext;
import org.springframework.core.env.ConfigurableEnvironment;

import java.time.LocalTime;

@Slf4j
public class MySpringApplicationRunListener implements SpringApplicationRunListener {

    private Long startTime;

    public MySpringApplicationRunListener(SpringApplication application, String[] args) {
    }

    @Override
    public void starting(ConfigurableBootstrapContext bootstrapContext) {
        startTime = System.currentTimeMillis();
        log.info("MySpringListener启动开始 {}", LocalTime.now());
    }

    @Override
    public void environmentPrepared(ConfigurableBootstrapContext bootstrapContext, ConfigurableEnvironment environment) {
        log.info("MySpringListener环境准备 准备耗时：{}毫秒", (System.currentTimeMillis() - startTime));
        startTime = System.currentTimeMillis();
    }

    @Override
    public void contextPrepared(ConfigurableApplicationContext context) {
        log.info("MySpringListener上下文准备 耗时：{}毫秒", (System.currentTimeMillis() - startTime));
        startTime = System.currentTimeMillis();
    }

    @Override
    public void contextLoaded(ConfigurableApplicationContext context) {
        log.info("MySpringListener上下文载入 耗时：{}毫秒", (System.currentTimeMillis() - startTime));
        startTime = System.currentTimeMillis();
    }

    @Override
    public void started(ConfigurableApplicationContext context) {
        log.info("MySpringListener启动完成 耗时：{}毫秒", (System.currentTimeMillis() - startTime));
        startTime = System.currentTimeMillis();
    }

    @Override
    public void running(ConfigurableApplicationContext context) {
        log.info("MySpringListener正在运行 {}", LocalTime.now());
    }

    @Override
    public void failed(ConfigurableApplicationContext context, Throwable exception) {
        log.error("MySpringListener启动失败", exception);
    }
}

从日志中可以看到，从"上下文载入"到"启动完成"这一步整整花费了 45 秒：

bash 复制代码

2026-03-17 10:52:59.863  INFO  [main] - c.e.q.l.MySpringApplicationRunListener:28 MySpringListener环境准备 准备耗时：140毫秒

2026-03-17 10:52:59.901  INFO  [main] - c.e.q.l.MySpringApplicationRunListener:34 MySpringListener上下文准备 耗时：37毫秒

2026-03-17 10:52:59.992  INFO  [main] - c.e.q.l.MySpringApplicationRunListener:40 MySpringListener上下文载入 耗时：91毫秒
2026-03-17 10:53:45.479  INFO  [main] - c.e.q.l.MySpringApplicationRunListener:46 MySpringListener启动完成 耗时：45486毫秒

2026-03-17 10:53:45.480  INFO  [main] - c.e.q.l.MySpringApplicationRunListener:52 MySpringListener正在运行 10:53:45.480610

结合日志分析，从"上下文载入"到"启动完成"耗时 45 秒，这段时间主要对应 refreshContext() 方法的执行，即 Spring 容器的刷新过程，涉及 Bean 的实例化、依赖注入和初始化。因此我们将排查重点放在 IOC 容器的 Bean 加载环节。

从日志可以清晰看到，环境准备、上下文准备、上下文载入都很快（总计不到 1 秒），但从"上下文载入"到"启动完成"耗时高达 45 秒。这段时间主要是 refreshContext() 在执行，核心是 Bean 的实例化和依赖注入。接下来我们需要进一步细化定位是哪些 Bean 在拖累启动速度。

第二步：Bean 生命周期耗时监控

依赖注入即完成 Bean 的加载和注入，要想明确定位耗时点，我们需要一个类似上述拓展点的接口来观察 Bean 生命周期的耗时。

查阅资料后，笔者很快找到了 InstantiationAwareBeanPostProcessor 这个接口：

{@link BeanPostProcessor} 的子接口，它添加了两个回调方法：

实例化前回调**（before-instantiation callback）**
实例化后但在显式属性设置或自动装配发生前的回调**（callback after instantiation but before explicit properties are set or autowiring occurs）**

典型用途：

抑制特定目标 bean 的默认实例化
例如：创建带有特殊 TargetSource 的代理（如池化目标、延迟初始化目标等）
实现额外的注入策略，如字段注入（field injection）

注意：这是一个特殊用途的接口，主要用于框架内部使用。建议尽可能实现普通的 {@link BeanPostProcessor} 接口。

基于该接口，我们可以实现一个 Bean 生命周期耗时监控器：

为什么选择 InstantiationAwareBeanPostProcessor？

普通的 BeanPostProcessor 只能在 Bean 初始化前后（postProcessBeforeInitialization/postProcessAfterInitialization）进行拦截，无法捕获 Bean 实例化阶段的耗时。

而 InstantiationAwareBeanPostProcessor 提供了更细粒度的扩展点：

postProcessBeforeInstantiation：实例化前（构造函数执行前）
postProcessAfterInstantiation：实例化后（构造函数执行后，属性注入前）
postProcessProperties：属性注入阶段

这样可以完整监控 Bean 从实例化到初始化完成的全流程耗时，更精准地定位性能瓶颈。

在编写提示词时，笔者先大致浏览了 InstantiationAwareBeanPostProcessor 的方法与逻辑，确保 AI 生成的代码符合预期。

对应源代码如下，笔者为了更直观看到问题的 Bean，以 5 秒作为阈值进行告警打印：

java 复制代码

import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.BeansException;
import org.springframework.beans.PropertyValues;
import org.springframework.beans.factory.config.InstantiationAwareBeanPostProcessor;
import org.springframework.stereotype.Component;

import java.beans.PropertyDescriptor;
import java.time.LocalDateTime;
import java.time.format.DateTimeFormatter;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;

/**
 * Bean创建耗时计算后置处理器
 * 
 * InstantiationAwareBeanPostProcessor 是 BeanPostProcessor 的子接口，
 * 它扩展了更多的扩展点，可以在 Bean 实例化前后进行干预。
 * 
 * Bean生命周期中的扩展点调用顺序：
 * 1. InstantiationAwareBeanPostProcessor.postProcessBeforeInstantiation() - 实例化前
 * 2. Bean构造函数执行
 * 3. InstantiationAwareBeanPostProcessor.postProcessAfterInstantiation() - 实例化后
 * 4. InstantiationAwareBeanPostProcessor.postProcessProperties() - 属性注入
 * 5. BeanPostProcessor.postProcessBeforeInitialization() - 初始化前
 * 6. @PostConstruct / InitializingBean.afterPropertiesSet() / init-method
 * 7. BeanPostProcessor.postProcessAfterInitialization() - 初始化后
 */
@Slf4j
@Component
public class TimeCostCalBeanPostProcessor implements InstantiationAwareBeanPostProcessor {

    private static final DateTimeFormatter TIME_FORMATTER = DateTimeFormatter.ofPattern("HH:mm:ss.SSS");

    private static final long WARN_THRESHOLD = 5000L;
    private static final long INFO_THRESHOLD = 1000L;
    private static final long DEBUG_THRESHOLD = 100L;

    private final Map<String, Long> costMap = new ConcurrentHashMap<>();

    private final Map<String, String> startTimeMap = new ConcurrentHashMap<>();

    @Override
    public Object postProcessBeforeInstantiation(Class<?> beanClass, String beanName) throws BeansException {
        if (!costMap.containsKey(beanName)) {
            long startTime = System.currentTimeMillis();
            costMap.put(beanName, startTime);
            startTimeMap.put(beanName, LocalDateTime.now().format(TIME_FORMATTER));
            log.debug("[Bean开始创建] {} - 类型: {}", beanName, beanClass.getSimpleName());
        }
        return null;
    }

    @Override
    public boolean postProcessAfterInstantiation(Object bean, String beanName) throws BeansException {
        return true;
    }

    @Override
    public PropertyValues postProcessProperties(PropertyValues pvs, Object bean, String beanName) throws BeansException {
        return pvs;
    }

    @Override
    @Deprecated
    public PropertyValues postProcessPropertyValues(PropertyValues pvs, PropertyDescriptor[] pds, Object bean, String beanName) throws BeansException {
        return pvs;
    }

    @Override
    public Object postProcessBeforeInitialization(Object bean, String beanName) throws BeansException {
        return bean;
    }

    @Override
    public Object postProcessAfterInitialization(Object bean, String beanName) throws BeansException {
        if (costMap.containsKey(beanName)) {
            Long start = costMap.get(beanName);
            String startTimeStr = startTimeMap.get(beanName);
            long cost = System.currentTimeMillis() - start;
            String endTimeStr = LocalDateTime.now().format(TIME_FORMATTER);

            if (cost > WARN_THRESHOLD) {
                log.warn("[Bean创建完成] {} | 开始: {} | 结束: {} | 耗时: {}ms ⚠️耗时过长",
                        beanName, startTimeStr, endTimeStr, cost);
            } else if (cost > INFO_THRESHOLD) {
                log.info("[Bean创建完成] {} | 开始: {} | 结束: {} | 耗时: {}ms",
                        beanName, startTimeStr, endTimeStr, cost);
            } else if (cost > DEBUG_THRESHOLD) {
                log.debug("[Bean创建完成] {} | 开始: {} | 结束: {} | 耗时: {}ms",
                        beanName, startTimeStr, endTimeStr, cost);
            }

            costMap.remove(beanName);
            startTimeMap.remove(beanName);
        }
        return bean;
    }
}

从日志中的 dataSource 和 Redisson 可以看出，当前容器中最耗时的操作是数据源的加载和缓存预热：

第三步：定位根因

定位到耗时操作所在的 Bean 后，接下来我们需要深入了解其内部工作机制。按照常规调试思路，我们采用宏观打点、逐步深入的策略。

以 DataSource 为例，我们在实例化阶段设置断点，追踪后续耗时的调用：

经过逐步跳过，我们发现 doCreateBean 出现长时间卡顿，于是在这里设置断点，下一轮调试直接从这里开始深入分析：

同理，我们在初始化环节也遇到了较长的等待：

最终，我们定位到了根因：项目中引入的多数据源，在 asyncInit（默认为 false）的情况下，数据源是逐个进行加载，由于数据源较多导致网络 I/O 将主流程阻塞，进而导致启动效率低下：

java 复制代码

public void init() throws SQLException {
       //......

        boolean init = false;
        try {
         	 //......

            if (createScheduler != null && asyncInit) { //若asyncInit则并行加载数据源
                for (int i = 0; i < initialSize; ++i) {
                    submitCreateTask(true);
                }
            } else if (!asyncInit) {//串行加载数据源
                // init connections
                while (poolingCount < initialSize) {
                    try {
                        PhysicalConnectionInfo pyConnectInfo = createPhysicalConnection();
                        DruidConnectionHolder holder = new DruidConnectionHolder(this, pyConnectInfo);
                        connections[poolingCount++] = holder;
                    } catch (SQLException ex) {
                       //......
                    }
                }

                //......

            initedLatch.await();
            init = true;

            //......

        } catch (SQLException e) {
         //......

        } finally {
           //......
        }
    }

优化实践与效果验证

明确根因后，只需定位对应变量的配置即可。这属于繁琐的追踪和配置工作，为提升效率，我将任务提交给 AI，让其自行分析上下文并完成优化。

bash 复制代码

通过配置多数据源内置的参数即可解决当前问题。具体而言，解决方案涉及调整DruidDataSource类中init()方法内部的asyncInit参数配置。请详细分析该参数的作用机制，修改相关配置项，并验证其对多数据源初始化流程的影响，确保问题得到有效解决。

在此期间，我通过搜索引擎对照验证，确保解决思路与通用方案一致后再验收 AI 的处理结果：

经过配置优化后，对于数据源优化，在 application.properties 中为每个数据源添加异步初始化配置：

properties 复制代码

spring.datasource.dynamic.datasource.primary.druid.async-init=true
spring.datasource.dynamic.datasource.secondary.druid.async-init=true
spring.datasource.dynamic.datasource.analytics.druid.async-init=true
spring.datasource.dynamic.datasource.archive.druid.async-init=true
spring.datasource.dynamic.datasource.config.druid.async-init=true

注意事项：

异步初始化依赖 createScheduler，若未配置会自动回退到同步初始化模式
异步初始化可能导致启动后短暂时间内连接池未完全就绪，首次请求可能稍慢
建议配合 initial-size 合理设置初始连接数，避免启动时创建过多连接

方案选型思考 ：最初也有同事建议使用 Spring 的 @Lazy 懒加载来优化启动速度，但我们评估后放弃了这个方案：

懒加载会影响首次请求体验，将启动成本转移到运行时
无法解决数据源预热的需求，连接池仍需在首次使用时初始化
异步初始化是更优解，将初始化从主流程剥离到后台线程

排查过程中的挑战：在定位问题过程中，我们也遇到了一些困难。Bean 数量庞大，日志信息过多，难以快速筛选关键耗时点。通过设置阈值（5秒）进行日志过滤，才快速定位到目标 Bean。这也是一个经验总结：面对大量日志时，阈值过滤是提升效率的关键。

除数据源外，缓存预热也存在类似问题。系统配置和用户黑名单需要从数据库加载数据到 Redis，若在 Bean 初始化阶段同步执行，会阻塞启动流程。优化后，使用 CompletableFuture 实现异步预热：

java 复制代码

@PostConstruct
public void warmup() {
    // 异步并行加载，不阻塞主流程
    CompletableFuture<Void> configFuture = warmupSystemConfigAsync();
    CompletableFuture<Void> blacklistFuture = warmupUserBlacklistAsync();
    CompletableFuture.allOf(configFuture, blacklistFuture)
            .thenRun(() -> log.info("=== Cache warmup completed ==="));
}

这样缓存预热不会阻塞 Spring 容器的启动过程。最终代码效果如下：

小结

完成问题修复后，服务启动速度由 1 分钟 优化至 13 秒：

效果验证方法：

本地多次启动测试，平均启动时间从 60s 降至 13s
监控启动后首次 DB/Redis 请求耗时，确保连接池已就绪
压测验证异步初始化不会影响线上稳定性

可以看到，整个过程中我一直以自己的思路为主导，给定明确的方法论，引导 AI 按照正确的上下文构建推理路径。例如：

在问题排查阶段，我先了解 Spring Boot 的启动流程，明确容器具体的慢加载点，然后将接口定义交由 AI 进行编码实现
确定容器刷新较慢后，结合对 IOC 的理解，寻找能够定位 Bean 生命周期的拓展点，让 AI 完成处理器代码

最后，借助这些追踪工具定位到具体 Bean 信息后，我将繁琐的配置工作提交给 AI 完成，从而提升整体效率。

参考

Spring Boot 启动优化实践:https://www.cnblogs.com/vivotech/p/18936065