Java 线程池优化

一、线程池参数优化策略

1.1 CPU密集型 vs IO密集型任务

java 复制代码

// CPU核心数获取
int cpuCores = Runtime.getRuntime().availableProcessors();

// 1. CPU密集型任务优化
// 公式：corePoolSize = CPU核心数 + 1
// 原因：避免过多的上下文切换，充分利用CPU
ThreadPoolExecutor cpuIntensiveExecutor = new ThreadPoolExecutor(
    cpuCores + 1,                     // 核心线程数
    cpuCores + 1,                     // 最大线程数（等于核心线程数）
    0L, TimeUnit.MILLISECONDS,       // 无需保活
    new LinkedBlockingQueue<>(1000),  // 使用有界队列
    new CustomThreadFactory("cpu-intensive"),
    new ThreadPoolExecutor.AbortPolicy()
);

// 2. IO密集型任务优化
// 公式：corePoolSize = CPU核心数 * 2
// 公式：maximumPoolSize = CPU核心数 * 4
// 原因：IO等待时CPU可以处理其他线程
ThreadPoolExecutor ioIntensiveExecutor = new ThreadPoolExecutor(
    cpuCores * 2,                     // 核心线程数
    cpuCores * 4,                     // 最大线程数
    60L, TimeUnit.SECONDS,           // 较长保活时间
    new LinkedBlockingQueue<>(1000),  // 使用有界队列
    new CustomThreadFactory("io-intensive"),
    new ThreadPoolExecutor.CallerRunsPolicy()
);

// 3. 混合型任务优化
// 动态调整策略
public class DynamicThreadPool extends ThreadPoolExecutor {
    private long lastCheckTime = System.currentTimeMillis();
    private static final long CHECK_INTERVAL = 5000; // 5秒检查一次
    
    public DynamicThreadPool() {
        super(cpuCores * 2, cpuCores * 8, 60L, TimeUnit.SECONDS,
              new ResizableCapacityQueue<>(1000));
    }
    
    @Override
    protected void afterExecute(Runnable r, Throwable t) {
        super.afterExecute(r, t);
        adjustPoolSizeIfNeeded();
    }
    
    private void adjustPoolSizeIfNeeded() {
        long now = System.currentTimeMillis();
        if (now - lastCheckTime > CHECK_INTERVAL) {
            lastCheckTime = now;
            
            int activeCount = getActiveCount();
            int poolSize = getPoolSize();
            double loadFactor = (double) activeCount / poolSize;
            
            if (loadFactor > 0.8) {
                // 负载过高，增加线程
                setMaximumPoolSize(Math.min(getMaximumPoolSize() + 2, cpuCores * 16));
            } else if (loadFactor < 0.3) {
                // 负载过低，减少线程
                setMaximumPoolSize(Math.max(getMaximumPoolSize() - 1, cpuCores * 2));
            }
        }
    }
}

1.2 队列容量优化

java 复制代码

// 队列容量计算公式
// 最佳队列容量 = (任务平均执行时间 / 任务到达间隔) * 线程数 * 缓冲系数

public class QueueCapacityOptimizer {
    
    /**
     * 计算最佳队列容量
     * @param taskProcessingTime 任务平均处理时间(ms)
     * @param taskArrivalInterval 任务平均到达间隔(ms)
     * @param threadCount 线程数
     * @param bufferFactor 缓冲系数(1.2-2.0)
     * @return 队列容量
     */
    public static int calculateOptimalQueueCapacity(
            long taskProcessingTime,
            long taskArrivalInterval,
            int threadCount,
            double bufferFactor) {
        
        if (taskArrivalInterval == 0) {
            return 1000; // 默认值
        }
        
        double arrivalRate = 1000.0 / taskArrivalInterval; // 每秒到达任务数
        double serviceRate = (1000.0 / taskProcessingTime) * threadCount; // 每秒处理任务数
        
        if (serviceRate <= arrivalRate) {
            // 处理能力不足，需要增大队列或线程数
            return Integer.MAX_VALUE; // 警告：可能产生OOM
        }
        
        // 使用排队论公式计算
        double utilization = arrivalRate / serviceRate;
        double expectedQueueLength = (utilization * utilization) / (1 - utilization);
        
        return (int) (expectedQueueLength * bufferFactor);
    }
    
    // 动态调整队列容量
    static class ResizableCapacityQueue<E> extends LinkedBlockingQueue<E> {
        private volatile int capacity;
        
        public ResizableCapacityQueue(int initialCapacity) {
            super(initialCapacity);
            this.capacity = initialCapacity;
        }
        
        public synchronized void setCapacity(int newCapacity) {
            this.capacity = newCapacity;
        }
        
        @Override
        public boolean offer(E e) {
            // 动态检查并调整队列容量
            if (size() >= capacity * 0.8) {
                // 队列即将满，可以考虑动态扩容
                if (shouldExpandCapacity()) {
                    setCapacity((int) (capacity * 1.5));
                }
            }
            return super.offer(e);
        }
        
        private boolean shouldExpandCapacity() {
            // 根据系统负载决定是否扩容
            double systemLoad = ManagementFactory.getOperatingSystemMXBean()
                    .getSystemLoadAverage();
            return systemLoad < cpuCores * 0.7; // 系统负载低于70%时扩容
        }
    }
}

二、线程池监控与调优

2.1 全面监控指标

java 复制代码

public class ThreadPoolMonitor {
    private final ThreadPoolExecutor executor;
    private final ScheduledExecutorService monitorExecutor;
    private final Map<String, Object> metrics = new ConcurrentHashMap<>();
    
    public ThreadPoolMonitor(ThreadPoolExecutor executor) {
        this.executor = executor;
        this.monitorExecutor = Executors.newSingleThreadScheduledExecutor();
        startMonitoring();
    }
    
    private void startMonitoring() {
        // 每5秒收集一次指标
        monitorExecutor.scheduleAtFixedRate(() -> {
            collectMetrics();
            checkAndAdjust();
            alertIfNeeded();
        }, 0, 5, TimeUnit.SECONDS);
    }
    
    private void collectMetrics() {
        metrics.put("corePoolSize", executor.getCorePoolSize());
        metrics.put("poolSize", executor.getPoolSize());
        metrics.put("activeCount", executor.getActiveCount());
        metrics.put("largestPoolSize", executor.getLargestPoolSize());
        metrics.put("maximumPoolSize", executor.getMaximumPoolSize());
        metrics.put("completedTaskCount", executor.getCompletedTaskCount());
        metrics.put("taskCount", executor.getTaskCount());
        metrics.put("queueSize", executor.getQueue().size());
        metrics.put("queueRemainingCapacity", executor.getQueue().remainingCapacity());
        
        // 计算关键性能指标
        double utilization = (double) executor.getActiveCount() / 
                           executor.getMaximumPoolSize();
        metrics.put("threadUtilization", utilization);
        
        double queueLoad = (double) executor.getQueue().size() / 
                         (executor.getQueue().size() + 
                          executor.getQueue().remainingCapacity());
        metrics.put("queueLoad", queueLoad);
        
        // 计算平均任务执行时间（需要扩展ThreadPoolExecutor来实现）
        if (executor instanceof MonitoredThreadPoolExecutor) {
            MonitoredThreadPoolExecutor monitored = (MonitoredThreadPoolExecutor) executor;
            metrics.put("avgTaskTime", monitored.getAverageTaskTime());
            metrics.put("maxTaskTime", monitored.getMaxTaskTime());
            metrics.put("taskThroughput", monitored.getTaskThroughput());
        }
    }
    
    private void checkAndAdjust() {
        double threadUtilization = (double) metrics.get("threadUtilization");
        double queueLoad = (double) metrics.get("queueLoad");
        
        // 动态调整策略
        if (threadUtilization > 0.8 && queueLoad > 0.7) {
            // 线程繁忙且队列负载高，考虑扩容
            adjustPoolSize(+2);
        } else if (threadUtilization < 0.3 && queueLoad < 0.2) {
            // 线程空闲且队列负载低，考虑缩容
            adjustPoolSize(-1);
        }
    }
    
    private synchronized void adjustPoolSize(int delta) {
        int newMaxSize = executor.getMaximumPoolSize() + delta;
        int newCoreSize = executor.getCorePoolSize() + delta;
        
        // 设置边界
        newMaxSize = Math.max(cpuCores, Math.min(newMaxSize, cpuCores * 16));
        newCoreSize = Math.max(1, Math.min(newCoreSize, newMaxSize));
        
        executor.setMaximumPoolSize(newMaxSize);
        executor.setCorePoolSize(newCoreSize);
        
        log.info("调整线程池大小: core={}, max={}", newCoreSize, newMaxSize);
    }
    
    private void alertIfNeeded() {
        // 告警规则
        if ((double) metrics.get("threadUtilization") > 0.9) {
            log.warn("线程池利用率超过90%: {}", metrics.get("threadUtilization"));
        }
        
        if ((double) metrics.get("queueLoad") > 0.8) {
            log.warn("队列负载超过80%: {}", metrics.get("queueLoad"));
        }
        
        // 长时间运行任务检测
        if (executor instanceof MonitoredThreadPoolExecutor) {
            MonitoredThreadPoolExecutor monitored = (MonitoredThreadPoolExecutor) executor;
            if (monitored.getLongRunningTasks() > 0) {
                log.warn("检测到{}个长时间运行任务", monitored.getLongRunningTasks());
            }
        }
    }
    
    public Map<String, Object> getMetrics() {
        return new HashMap<>(metrics);
    }
}

2.2 扩展ThreadPoolExecutor实现详细监控

java 复制代码

public class MonitoredThreadPoolExecutor extends ThreadPoolExecutor {
    // 监控数据
    private final AtomicLong totalTaskTime = new AtomicLong(0);
    private final AtomicLong totalTasks = new AtomicLong(0);
    private final AtomicLong maxTaskTime = new AtomicLong(0);
    private final ConcurrentHashMap<Thread, Long> runningTasks = new ConcurrentHashMap<>();
    private final AtomicInteger longRunningTasks = new AtomicInteger(0);
    
    // 任务执行时间阈值（毫秒）
    private final long longRunningThreshold = 30000; // 30秒
    
    public MonitoredThreadPoolExecutor(int corePoolSize, int maximumPoolSize,
                                       long keepAliveTime, TimeUnit unit,
                                       BlockingQueue<Runnable> workQueue) {
        super(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue);
    }
    
    @Override
    protected void beforeExecute(Thread t, Runnable r) {
        super.beforeExecute(t, r);
        runningTasks.put(t, System.currentTimeMillis());
    }
    
    @Override
    protected void afterExecute(Runnable r, Throwable t) {
        super.afterExecute(r, t);
        Thread current = Thread.currentThread();
        Long startTime = runningTasks.remove(current);
        if (startTime != null) {
            long taskTime = System.currentTimeMillis() - startTime;
            totalTaskTime.addAndGet(taskTime);
            totalTasks.incrementAndGet();
            
            // 更新最大执行时间
            maxTaskTime.updateAndGet(current -> Math.max(current, taskTime));
            
            // 检测长时间运行任务
            if (taskTime > longRunningThreshold) {
                longRunningTasks.incrementAndGet();
                logLongRunningTask(r, taskTime);
            }
        }
        
        // 定期清理长时间运行任务计数
        if (totalTasks.get() % 100 == 0) {
            longRunningTasks.set(0);
        }
    }
    
    private void logLongRunningTask(Runnable r, long taskTime) {
        log.warn("长时间运行任务检测 - 执行时间: {}ms, 任务: {}", 
                taskTime, r.getClass().getSimpleName());
    }
    
    // 监控指标获取方法
    public double getAverageTaskTime() {
        long tasks = totalTasks.get();
        if (tasks == 0) return 0;
        return (double) totalTaskTime.get() / tasks;
    }
    
    public long getMaxTaskTime() {
        return maxTaskTime.get();
    }
    
    public double getTaskThroughput() {
        long elapsed = System.currentTimeMillis() - getStartTime();
        if (elapsed == 0) return 0;
        return (double) totalTasks.get() / (elapsed / 1000.0);
    }
    
    public int getLongRunningTasks() {
        return longRunningTasks.get();
    }
    
    public Map<Thread, Long> getCurrentlyRunningTasks() {
        Map<Thread, Long> result = new HashMap<>();
        long now = System.currentTimeMillis();
        runningTasks.forEach((thread, startTime) -> {
            result.put(thread, now - startTime);
        });
        return result;
    }
    
    private long getStartTime() {
        // 线程池启动时间
        return ManagementFactory.getRuntimeMXBean().getStartTime();
    }
}

三、线程池高级优化技巧

3.1 任务优先级处理

java 复制代码

public class PriorityThreadPoolExecutor extends ThreadPoolExecutor {
    
    public PriorityThreadPoolExecutor(int corePoolSize, int maximumPoolSize,
                                     long keepAliveTime, TimeUnit unit) {
        super(corePoolSize, maximumPoolSize, keepAliveTime, unit, 
              new PriorityBlockingQueue<>(11, new TaskPriorityComparator()));
    }
    
    static class TaskPriorityComparator implements Comparator<Runnable> {
        @Override
        public int compare(Runnable o1, Runnable o2) {
            int p1 = getPriority(o1);
            int p2 = getPriority(o2);
            return Integer.compare(p1, p2); // 数值越小优先级越高
        }
        
        private int getPriority(Runnable runnable) {
            if (runnable instanceof PriorityTask) {
                return ((PriorityTask) runnable).getPriority();
            }
            return PriorityTask.NORMAL;
        }
    }
    
    // 带优先级的任务
    public interface PriorityTask extends Runnable {
        int HIGH = 1;
        int NORMAL = 5;
        int LOW = 10;
        
        int getPriority();
    }
    
    // 使用示例
    public static void main(String[] args) {
        PriorityThreadPoolExecutor executor = new PriorityThreadPoolExecutor(
            2, 4, 60L, TimeUnit.SECONDS);
        
        // 提交不同优先级的任务
        executor.submit(() -> {
            System.out.println("高优先级任务");
        }); // 默认NORMAL优先级
        
        // 自定义优先级任务
        executor.submit(new PriorityTask() {
            @Override
            public void run() {
                System.out.println("最高优先级任务");
            }
            
            @Override
            public int getPriority() {
                return HIGH;
            }
        });
    }
}

3.2 任务分批处理

java 复制代码

public class BatchTaskProcessor {
    private final ThreadPoolExecutor executor;
    private final int batchSize;
    private final List<Future<?>> futures = new ArrayList<>();
    
    public BatchTaskProcessor(int threadCount, int batchSize) {
        this.batchSize = batchSize;
        this.executor = new ThreadPoolExecutor(
            threadCount, threadCount, 0L, TimeUnit.MILLISECONDS,
            new LinkedBlockingQueue<>(),
            new ThreadFactoryBuilder().setNameFormat("batch-processor-%d").build()
        );
    }
    
    /**
     * 批量提交任务
     */
    public void submitBatch(List<Runnable> tasks) {
        // 分批处理
        for (int i = 0; i < tasks.size(); i += batchSize) {
            int end = Math.min(i + batchSize, tasks.size());
            List<Runnable> batch = tasks.subList(i, end);
            
            Future<?> future = executor.submit(() -> processBatch(batch));
            futures.add(future);
            
            // 控制并发批次数量
            if (futures.size() >= executor.getMaximumPoolSize() * 2) {
                waitForSomeCompletion();
            }
        }
        
        // 等待所有批次完成
        waitForAllCompletion();
    }
    
    private void processBatch(List<Runnable> batch) {
        // 批量处理逻辑
        for (Runnable task : batch) {
            try {
                task.run();
            } catch (Exception e) {
                // 批量处理中单任务失败不影响其他任务
                log.error("任务执行失败", e);
            }
        }
    }
    
    private void waitForSomeCompletion() {
        // 等待至少一个批次完成
        while (true) {
            Iterator<Future<?>> iterator = futures.iterator();
            while (iterator.hasNext()) {
                Future<?> future = iterator.next();
                if (future.isDone()) {
                    iterator.remove();
                    return;
                }
            }
            
            try {
                Thread.sleep(10);
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
                break;
            }
        }
    }
    
    private void waitForAllCompletion() {
        for (Future<?> future : futures) {
            try {
                future.get();
            } catch (Exception e) {
                log.error("批次执行失败", e);
            }
        }
        futures.clear();
    }
}

3.3 线程池预热

java 复制代码

public class WarmUpThreadPool {
    
    /**
     * 线程池预热
     * @param executor 线程池
     * @param warmUpCount 预热任务数
     */
    public static void warmUp(ThreadPoolExecutor executor, int warmUpCount) {
        if (executor.getCorePoolSize() <= 0) {
            return;
        }
        
        CountDownLatch latch = new CountDownLatch(warmUpCount);
        
        // 提交预热任务
        for (int i = 0; i < warmUpCount; i++) {
            executor.submit(() -> {
                try {
                    // 模拟预热任务（简单计算）
                    long start = System.currentTimeMillis();
                    for (int j = 0; j < 1000; j++) {
                        Math.sqrt(j);
                    }
                    Thread.sleep(10); // 模拟IO
                } catch (InterruptedException e) {
                    Thread.currentThread().interrupt();
                } finally {
                    latch.countDown();
                }
            });
        }
        
        // 等待预热完成
        try {
            latch.await(30, TimeUnit.SECONDS);
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        }
        
        log.info("线程池预热完成，当前线程数: {}", executor.getPoolSize());
    }
    
    /**
     * 按需预热：在低峰期预热线程池
     */
    public static class OnDemandWarmUp {
        private final ThreadPoolExecutor executor;
        private final ScheduledExecutorService scheduler;
        private final int targetWarmUpThreads;
        
        public OnDemandWarmUp(ThreadPoolExecutor executor, int targetWarmUpThreads) {
            this.executor = executor;
            this.targetWarmUpThreads = targetWarmUpThreads;
            this.scheduler = Executors.newScheduledThreadPool(1);
            scheduleWarmUp();
        }
        
        private void scheduleWarmUp() {
            // 每天凌晨3点预热
            scheduler.scheduleAtFixedRate(this::doWarmUp, 
                calculateInitialDelay(), 
                24 * 60 * 60, // 24小时
                TimeUnit.SECONDS);
        }
        
        private long calculateInitialDelay() {
            Calendar calendar = Calendar.getInstance();
            calendar.add(Calendar.DAY_OF_MONTH, 1);
            calendar.set(Calendar.HOUR_OF_DAY, 3);
            calendar.set(Calendar.MINUTE, 0);
            calendar.set(Calendar.SECOND, 0);
            
            return (calendar.getTimeInMillis() - System.currentTimeMillis()) / 1000;
        }
        
        private void doWarmUp() {
            int currentThreads = executor.getPoolSize();
            if (currentThreads < targetWarmUpThreads) {
                int needToCreate = targetWarmUpThreads - currentThreads;
                warmUp(executor, needToCreate);
            }
        }
    }
}

四、生产环境最佳实践

4.1 线程池配置管理

java 复制代码

@Configuration
public class ThreadPoolConfig {
    
    // 线程池配置中心（可动态调整）
    @Component
    @RefreshScope // Spring Cloud配置刷新
    public class ThreadPoolProperties {
        @Value("${threadpool.core.size:8}")
        private int corePoolSize;
        
        @Value("${threadpool.max.size:32}")
        private int maxPoolSize;
        
        @Value("${threadpool.queue.capacity:1000}")
        private int queueCapacity;
        
        @Value("${threadpool.keepalive.time:60}")
        private long keepAliveTime;
        
        // getters and setters
    }
    
    // 业务线程池注册表
    @Component
    public class ThreadPoolRegistry {
        private final Map<String, ThreadPoolExecutor> registry = new ConcurrentHashMap<>();
        private final ThreadPoolProperties properties;
        
        public ThreadPoolRegistry(ThreadPoolProperties properties) {
            this.properties = properties;
        }
        
        public ThreadPoolExecutor getOrCreate(String poolName) {
            return registry.computeIfAbsent(poolName, name -> {
                return createThreadPool(name);
            });
        }
        
        private ThreadPoolExecutor createThreadPool(String name) {
            return new DynamicThreadPoolExecutor(
                properties.getCorePoolSize(),
                properties.getMaxPoolSize(),
                properties.getKeepAliveTime(),
                TimeUnit.SECONDS,
                new ResizableCapacityQueue<>(properties.getQueueCapacity()),
                new NamedThreadFactory(name),
                new ThreadPoolExecutor.CallerRunsPolicy()
            );
        }
        
        // 动态更新所有线程池配置
        @EventListener
        public void onPropertiesRefresh(EnvironmentChangeEvent event) {
            if (event.getKeys().stream().anyMatch(k -> k.startsWith("threadpool"))) {
                registry.values().forEach(executor -> {
                    executor.setCorePoolSize(properties.getCorePoolSize());
                    executor.setMaximumPoolSize(properties.getMaxPoolSize());
                });
            }
        }
    }
}

// 动态线程池（支持运行时调整）
class DynamicThreadPoolExecutor extends ThreadPoolExecutor {
    private final String poolName;
    private final ThreadPoolMonitor monitor;
    
    public DynamicThreadPoolExecutor(int corePoolSize, int maximumPoolSize,
                                     long keepAliveTime, TimeUnit unit,
                                     BlockingQueue<Runnable> workQueue,
                                     ThreadFactory threadFactory,
                                     RejectedExecutionHandler handler) {
        super(corePoolSize, maximumPoolSize, keepAliveTime, unit, 
              workQueue, threadFactory, handler);
        this.poolName = ((NamedThreadFactory) threadFactory).getPoolName();
        this.monitor = new ThreadPoolMonitor(this);
    }
    
    @Override
    public void setCorePoolSize(int corePoolSize) {
        super.setCorePoolSize(corePoolSize);
        log.info("线程池[{}]核心线程数调整为: {}", poolName, corePoolSize);
    }
    
    @Override
    public void setMaximumPoolSize(int maximumPoolSize) {
        super.setMaximumPoolSize(maximumPoolSize);
        log.info("线程池[{}]最大线程数调整为: {}", poolName, maximumPoolSize);
    }
}

4.2 线程池隔离策略

java 复制代码

public class ThreadPoolIsolation {
    
    /**
     * 线程池隔离策略：不同业务使用不同线程池
     */
    @Component
    public class BusinessThreadPoolManager {
        // 关键业务线程池（高优先级）
        private final ThreadPoolExecutor criticalBusinessExecutor;
        
        // 普通业务线程池（中优先级）
        private final ThreadPoolExecutor normalBusinessExecutor;
        
        // 后台任务线程池（低优先级）
        private final ThreadPoolExecutor backgroundExecutor;
        
        // 批量处理线程池
        private final ThreadPoolExecutor batchExecutor;
        
        public BusinessThreadPoolManager() {
            int cpuCores = Runtime.getRuntime().availableProcessors();
            
            // 关键业务：快速响应，队列小，拒绝策略为调用者执行
            criticalBusinessExecutor = new ThreadPoolExecutor(
                cpuCores * 2, cpuCores * 4, 30L, TimeUnit.SECONDS,
                new ArrayBlockingQueue<>(100),
                new NamedThreadFactory("critical-business"),
                new ThreadPoolExecutor.CallerRunsPolicy()
            );
            
            // 普通业务：平衡处理，中等队列
            normalBusinessExecutor = new ThreadPoolExecutor(
                cpuCores * 4, cpuCores * 8, 60L, TimeUnit.SECONDS,
                new LinkedBlockingQueue<>(1000),
                new NamedThreadFactory("normal-business"),
                new ThreadPoolExecutor.AbortPolicy()
            );
            
            // 后台任务：允许排队，大队列
            backgroundExecutor = new ThreadPoolExecutor(
                cpuCores, cpuCores * 2, 300L, TimeUnit.SECONDS,
                new LinkedBlockingQueue<>(5000),
                new NamedThreadFactory("background"),
                new ThreadPoolExecutor.DiscardOldestPolicy()
            );
            
            // 批量处理：固定大小，同步队列
            batchExecutor = new ThreadPoolExecutor(
                cpuCores, cpuCores, 0L, TimeUnit.MILLISECONDS,
                new SynchronousQueue<>(),
                new NamedThreadFactory("batch"),
                new ThreadPoolExecutor.CallerRunsPolicy()
            );
        }
        
        // 根据业务类型选择线程池
        public ThreadPoolExecutor selectExecutor(BusinessType type) {
            switch (type) {
                case CRITICAL:
                    return criticalBusinessExecutor;
                case NORMAL:
                    return normalBusinessExecutor;
                case BACKGROUND:
                    return backgroundExecutor;
                case BATCH:
                    return batchExecutor;
                default:
                    return normalBusinessExecutor;
            }
        }
        
        // 优雅关闭所有线程池
        @PreDestroy
        public void shutdownAll() {
            shutdownExecutor(criticalBusinessExecutor, "关键业务线程池");
            shutdownExecutor(normalBusinessExecutor, "普通业务线程池");
            shutdownExecutor(backgroundExecutor, "后台任务线程池");
            shutdownExecutor(batchExecutor, "批量处理线程池");
        }
        
        private void shutdownExecutor(ExecutorService executor, String name) {
            try {
                executor.shutdown();
                if (!executor.awaitTermination(60, TimeUnit.SECONDS)) {
                    log.warn("{}等待60秒后仍未完全关闭，强制关闭", name);
                    executor.shutdownNow();
                }
            } catch (InterruptedException e) {
                executor.shutdownNow();
                Thread.currentThread().interrupt();
            }
        }
    }
    
    enum BusinessType {
        CRITICAL,   // 关键业务：订单、支付等
        NORMAL,     // 普通业务：查询、统计等
        BACKGROUND, // 后台任务：数据同步、清理等
        BATCH       // 批量处理：报表生成、数据导出等
    }
}

4.3 故障恢复与熔断

java 复制代码

public class ResilientThreadPool {
    
    /**
     * 具有故障恢复能力的线程池
     */
    public static class ResilientThreadPoolExecutor extends ThreadPoolExecutor {
        private final CircuitBreaker circuitBreaker;
        private final HealthChecker healthChecker;
        
        public ResilientThreadPoolExecutor(int corePoolSize, int maximumPoolSize,
                                          long keepAliveTime, TimeUnit unit,
                                          BlockingQueue<Runnable> workQueue) {
            super(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue);
            this.circuitBreaker = new CircuitBreaker();
            this.healthChecker = new HealthChecker(this);
            
            // 启动健康检查
            healthChecker.start();
        }
        
        @Override
        public void execute(Runnable command) {
            // 检查熔断器状态
            if (circuitBreaker.isOpen()) {
                handleRejectedCommand(command);
                return;
            }
            
            try {
                super.execute(() -> {
                    try {
                        command.run();
                        circuitBreaker.recordSuccess();
                    } catch (Exception e) {
                        circuitBreaker.recordFailure();
                        throw e;
                    }
                });
            } catch (RejectedExecutionException e) {
                circuitBreaker.recordFailure();
                handleRejectedCommand(command);
            }
        }
        
        private void handleRejectedCommand(Runnable command) {
            // 降级策略
            if (command instanceof FallbackRunnable) {
                ((FallbackRunnable) command).fallback();
            } else {
                log.warn("任务被拒绝，已丢弃: {}", command);
            }
        }
        
        // 熔断器
        static class CircuitBreaker {
            private static final int FAILURE_THRESHOLD = 10;
            private static final long RESET_TIMEOUT = 60000; // 60秒
            
            private final AtomicInteger failureCount = new AtomicInteger(0);
            private final AtomicLong lastFailureTime = new AtomicLong(0);
            private volatile State state = State.CLOSED;
            
            enum State { OPEN, CLOSED, HALF_OPEN }
            
            public void recordFailure() {
                failureCount.incrementAndGet();
                lastFailureTime.set(System.currentTimeMillis());
                
                if (failureCount.get() >= FAILURE_THRESHOLD) {
                    state = State.OPEN;
                    log.error("线程池熔断器打开，当前失败次数: {}", failureCount.get());
                    
                    // 定时尝试恢复
                    scheduleReset();
                }
            }
            
            public void recordSuccess() {
                if (state == State.HALF_OPEN) {
                    state = State.CLOSED;
                    failureCount.set(0);
                    log.info("线程池熔断器关闭，恢复服务");
                }
            }
            
            public boolean isOpen() {
                if (state == State.OPEN) {
                    // 检查是否应该进入半开状态
                    if (System.currentTimeMillis() - lastFailureTime.get() > RESET_TIMEOUT) {
                        state = State.HALF_OPEN;
                        log.info("线程池熔断器进入半开状态，尝试恢复");
                    }
                }
                return state == State.OPEN;
            }
            
            private void scheduleReset() {
                ScheduledExecutorService scheduler = Executors.newSingleThreadScheduledExecutor();
                scheduler.schedule(() -> {
                    if (state == State.OPEN) {
                        state = State.HALF_OPEN;
                    }
                    scheduler.shutdown();
                }, RESET_TIMEOUT, TimeUnit.MILLISECONDS);
            }
        }
        
        // 健康检查器
        static class HealthChecker extends Thread {
            private final ThreadPoolExecutor executor;
            private volatile boolean running = true;
            
            public HealthChecker(ThreadPoolExecutor executor) {
                this.executor = executor;
                setDaemon(true);
                setName("threadpool-health-checker");
            }
            
            @Override
            public void run() {
                while (running) {
                    try {
                        Thread.sleep(30000); // 每30秒检查一次
                        
                        checkHealth();
                    } catch (InterruptedException e) {
                        Thread.currentThread().interrupt();
                        break;
                    }
                }
            }
            
            private void checkHealth() {
                // 检查死锁线程
                long deadThreads = executor.getActiveCount() - 
                                 executor.getCompletedTaskCount();
                if (deadThreads > executor.getMaximumPoolSize() * 0.5) {
                    log.error("线程池疑似死锁，活动线程数: {}", executor.getActiveCount());
                    // 可以触发告警或自动重启
                }
                
                // 检查内存使用
                double memoryUsage = (double) executor.getQueue().size() / 
                                   (executor.getQueue().size() + 
                                    executor.getQueue().remainingCapacity());
                if (memoryUsage > 0.9) {
                    log.warn("线程池队列内存使用率过高: {}%", memoryUsage * 100);
                }
            }
            
            public void stopChecking() {
                running = false;
                interrupt();
            }
        }
    }
    
    // 支持降级的任务
    interface FallbackRunnable extends Runnable {
        void fallback();
    }
}

五、性能测试与调优工具

5.1 线程池性能测试框架

java 复制代码

public class ThreadPoolBenchmark {
    
    public static class BenchmarkResult {
        private final String poolName;
        private final long totalTime;
        private final long totalTasks;
        private final double throughput;
        private final double avgTaskTime;
        private final int maxThreadsUsed;
        
        // constructor, getters
    }
    
    public static BenchmarkResult benchmark(
            String poolName,
            ThreadPoolExecutor executor,
            int taskCount,
            int taskComplexity) {
        
        CountDownLatch latch = new CountDownLatch(taskCount);
        List<Long> taskTimes = new ArrayList<>(taskCount);
        AtomicInteger maxThreads = new AtomicInteger(0);
        
        long startTime = System.currentTimeMillis();
        
        // 提交任务
        for (int i = 0; i < taskCount; i++) {
            final int taskId = i;
            executor.submit(() -> {
                long taskStart = System.currentTimeMillis();
                
                // 模拟任务处理
                simulateTask(taskComplexity);
                
                long taskTime = System.currentTimeMillis() - taskStart;
                taskTimes.add(taskTime);
                
                // 记录最大线程数
                int activeCount = executor.getActiveCount();
                maxThreads.updateAndGet(current -> Math.max(current, activeCount));
                
                latch.countDown();
            });
        }
        
        // 等待所有任务完成
        try {
            latch.await();
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        }
        
        long totalTime = System.currentTimeMillis() - startTime;
        
        // 计算统计数据
        double avgTaskTime = taskTimes.stream()
            .mapToLong(Long::longValue)
            .average()
            .orElse(0);
        
        double throughput = (double) taskCount / (totalTime / 1000.0);
        
        return new BenchmarkResult(
            poolName,
            totalTime,
            taskCount,
            throughput,
            avgTaskTime,
            maxThreads.get()
        );
    }
    
    private static void simulateTask(int complexity) {
        // 模拟不同复杂度的任务
        for (int i = 0; i < complexity; i++) {
            // CPU计算
            Math.pow(Math.random(), Math.random());
            
            // 模拟IO等待
            try {
                Thread.sleep(1);
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
                break;
            }
        }
    }
    
    // 自动调优工具
    public static ThreadPoolExecutor autoTune(int expectedTasksPerSecond, 
                                              int expectedTaskTimeMs) {
        int cpuCores = Runtime.getRuntime().availableProcessors();
        
        // 计算理论最佳参数
        double targetThroughput = expectedTasksPerSecond;
        double taskTimeSeconds = expectedTaskTimeMs / 1000.0;
        
        // 使用排队论公式计算
        double requiredThreads = targetThroughput * taskTimeSeconds;
        int coreThreads = (int) Math.ceil(requiredThreads * 1.2); // 20%缓冲
        
        // 限制边界
        coreThreads = Math.max(1, Math.min(coreThreads, cpuCores * 16));
        int maxThreads = coreThreads * 2;
        
        // 计算队列容量
        double utilization = 0.7; // 目标利用率70%
        double queueLength = (utilization * utilization) / (1 - utilization);
        int queueCapacity = (int) Math.ceil(queueLength * 100);
        
        log.info("自动调优结果: coreThreads={}, maxThreads={}, queueCapacity={}", 
                coreThreads, maxThreads, queueCapacity);
        
        return new ThreadPoolExecutor(
            coreThreads,
            maxThreads,
            60L, TimeUnit.SECONDS,
            new ArrayBlockingQueue<>(queueCapacity),
            new ThreadFactoryBuilder().setNameFormat("auto-tuned-%d").build(),
            new ThreadPoolExecutor.CallerRunsPolicy()
        );
    }
}

六、总结：线程池优化检查清单

6.1 配置优化检查点

核心线程数：根据任务类型（CPU/IO密集型）合理设置
最大线程数：设置上限，避免资源耗尽
队列容量：使用有界队列，避免OOM
拒绝策略：根据业务需求选择合适的策略
线程保活时间：合理设置，避免频繁创建销毁
线程命名：便于问题排查和监控

6.2 监控与告警检查点

线程利用率监控：设置阈值告警（如>85%）
队列监控：监控队列深度和等待时间
任务执行时间监控：检测长时间运行任务
拒绝任务监控：记录被拒绝的任务信息
系统资源监控：关联CPU、内存使用情况

6.3 高级优化检查点

线程池预热：提前创建核心线程
动态调整：根据负载自动调整参数
线程池隔离：关键业务独立线程池
任务优先级：区分高低优先级任务
熔断机制：故障时快速失败，避免雪崩
优雅关闭：应用关闭时正确处理未完成任务

6.4 性能测试检查点

基准测试：在不同负载下测试性能
压力测试：测试极限情况下的表现
稳定性测试：长时间运行测试稳定性
对比测试：不同配置的性能对比

最终建议：

从简单开始：开始时使用合理默认值，根据监控数据逐步优化
持续监控：线程池优化不是一次性的，需要持续监控和调整
业务驱动：优化策略必须基于实际业务需求和数据
容错设计：考虑各种异常情况，确保系统稳定性
文档记录：记录优化过程和结果，便于后续维护和调整

通过系统性的优化，线程池可以显著提升应用程序的性能和稳定性，特别是在高并发场景下效果尤为明显。