Java 线程池笔记

Created2026-01-24|Updated2026-02-28

|Word Count:106k|Reading Time:415mins|Post Views:

从执行器到线程池（from executor interface to thread pool implementation）

Pooling is the grouping together of resources (assets, equipment, personnel, effort, etc.) for the purposes of maximizing advantage or minimizing risk to the users. The term is used in finance, computing and equipment management.
——wikipedia

“池化”思想不仅仅能应用在计算机领域，在金融、设备、人员管理、工作管理等领域也有相关的应用。

在计算机领域中的表现为：统一管理IT资源，包括服务器、存储、和网络资源等等。通过共享资源，使用户在低投入中获益。除去线程池，还有其他比较典型的几种使用策略包括：

内存池(Memory Pooling)：预先申请内存，提升申请内存速度，减少内存碎片。连接池(Connection
Pooling)：预先申请数据库连接，提升申请连接的速度，降低系统的开销。实例池(Object
Pooling)：循环使用对象，减少资源在初始化和释放时的昂贵损耗。

本文模式总览

本文从源码和实践两个维度剖析 Java 线程池，提炼出以下可迁移的设计模式和工程实践模式。读者可先浏览此表建立全局认知，再深入各章节：

类别	模式	章节
工程实践	线程池选型三板斧	ThreadPoolExecutor 监控与调优实践
	有界队列+明确拒绝策略	任务缓冲：阻塞队列
	ThreadFactory 命名	ThreadPoolExecutor 监控与调优实践
	池隔离原则	ThreadPoolExecutor 监控与调优实践
	Spring @Scheduled 单线程陷阱	Spring @Scheduled 的默认陷阱
调度策略	Rate vs Delay	ScheduledThreadPoolExecutor 详解
	周期任务防御性编程	ScheduledThreadPoolExecutor 详解
	cancel 后清理队列	ScheduledThreadPoolExecutor 详解
并发设计	CAS + 锁分层	mainLock：线程池的全局互斥锁
	Worker 不可重入锁	Worker 类定义与锁状态
	FutureTask 状态机	FutureTask：任务包装的标准实现
异步编排	execute vs submit	任务提交入口：submit 与 execute
	CompletableFuture 异步编排	CompletableFuture
	CompletableFuture 完成保证	完成保证原则
	shutdown 优雅关闭	尝试关闭 ThreadPoolExecutor
未来方向	虚拟线程使用原则	虚拟线程的使用原则

Doug Lea 对线程池的期待有：

改善性能。
有界地利用资源（多次强调 bounds）。
提供统计。

执行器继承体系

“设计良好的API应该简单、一致、可扩展。”

ThreadPoolExecutorUML类图.png

我们将任务交给执行器，于是有了执行器（executor）；我们将执行器内部用 FutureTask 包装任务，于是有了同步转异步，异步转同步的设计，和多种 API（ExecutorService 和 AbstractExecutorService）；我们将执行器用线程池来实现，于是我们得到了线程池执行器（ThreadPoolExecutor）。

Executor：只定义"执行"契约
ExecutorService：定义生命周期、多种任务类型（Runnable/Callable）、批量任务契约

这两层都是契约层，方法之间没有明确关联。

AbstractExecutorService：只提供算法模板-这一层提供了其他执行方法在 execute 之上的实现，把 api 关联起来。但是唯独 execute 的实现空余了。也没有提供工作线程和拥塞队列的实现。
ThreadPoolExecutor：只实现 execute，并且围绕它搭建了一整套线程池的参考实现：Worker + 状态机 + 队列 + 拒绝策略 + 线程工厂。
FutureTask：只负责任务包装。但是它的两个父接口让它成为连接了 execute(Runnable)和Future.get()两个世界的桥梁。

classDiagram
    direction TB
    
    %% ========== 设计原则注释 ==========
    note for ThreadPoolExecutor "普通任务：生产者-消费者模式"
    note for ForkJoinPool "并行计算：工作窃取模式"
    
    %% ========== 契约层 ==========
    class Executor {
        <<interface>>
        +execute(Runnable command) void
        note: "契约层：只定义'执行'契约"
    }
    
    class ExecutorService {
        <<interface>>
        +submit(Callable~T~ task) Future~T~
        +invokeAll(Collection~Callable~T~~ tasks) List~Future~T~~
        +invokeAny(Collection~Callable~T~~ tasks) T
        +shutdown() void
        +awaitTermination(long timeout, TimeUnit unit) boolean
        note: "契约层：生命周期+批量任务"
    }
    
    class ScheduledExecutorService {
        <<interface>>
        +schedule(Runnable command, long delay, TimeUnit unit) ScheduledFuture~?~
        +schedule(Callable~V~ callable, long delay, TimeUnit unit) ScheduledFuture~V~
        +scheduleAtFixedRate(Runnable command, long initialDelay, long period, TimeUnit unit) ScheduledFuture~?~
        +scheduleWithFixedDelay(Runnable command, long initialDelay, long delay, TimeUnit unit) ScheduledFuture~?~
        note: "契约层：延迟和周期任务"
    }
    
    class Future {
        <<interface>>
        +cancel(boolean mayInterruptIfRunning) boolean
        +isCancelled() boolean
        +isDone() boolean
        +get() V
        +get(long timeout, TimeUnit unit) V
    }
    
    class RunnableFuture {
        <<interface>>
        note: "标记接口：Runnable+Future"
    }
    
    class ScheduledFuture {
        <<interface>>
    }
    
    class RunnableScheduledFuture {
        <<interface>>
        +isPeriodic() boolean
    }
    
    class RejectedExecutionHandler {
        <<interface>>
        +rejectedExecution(Runnable r, ThreadPoolExecutor executor) void
        note: "策略模式：饱和处理"
    }
    
    class ThreadFactory {
        <<interface>>
        +newThread(Runnable r) Thread
    }
    
    %% ========== 模板层 ==========
    class AbstractExecutorService {
        <<abstract>>
        #newTaskFor(Callable~T~ callable) RunnableFuture~T~
        #newTaskFor(Runnable runnable, V value) RunnableFuture~V~
        +submit(Callable~T~ task) Future~T~
        +submit(Runnable task, V result) Future~V~
        +invokeAll(Collection~Callable~T~~ tasks) List~Future~T~~
        +invokeAny(Collection~Callable~T~~ tasks) T
        note: "模板层：默认实现"
    }
    
    %% ========== 实现层 - ThreadPoolExecutor ==========
    class ThreadPoolExecutor {
        -corePoolSize: int
        -maximumPoolSize: int
        -keepAliveTime: long
        -workQueue: BlockingQueue~Runnable~
        -workers: HashSet~Worker~
        -ctl: AtomicInteger
        -threadFactory: ThreadFactory
        -handler: RejectedExecutionHandler
        +execute(Runnable command) void
        +shutdown() void
        +shutdownNow() List~Runnable~
        +beforeExecute(Thread t, Runnable r) void
        +afterExecute(Runnable r, Throwable t) void
        #terminated() void
        note: "ctl:高3位状态+低29位线程数"
    }
    
    class Worker {
        -thread: Thread
        -firstTask: Runnable
        -completedTasks: long
        +run() void
        +lock() void
        +unlock() void
        +isLocked() boolean
        +tryLock() boolean
        note: "继承AQS的不可重入锁"
    }
    
    class FutureTask {
        -callable: Callable~V~
        -outcome: Object
        -state: int
        -runner: Thread
        -waiters: WaitNode
        +run() void
        +get() V
        +get(long timeout, TimeUnit unit) V
        +cancel(boolean mayInterruptIfRunning) boolean
        +isCancelled() boolean
        +isDone() boolean
        -set(V v) boolean
        -setException(Throwable t) void
        -report(int s) V
        note: "状态机:NEW→COMPLETING→NORMAL/EXCEPTIONAL"
    }
    
    class AbortPolicy {
        +rejectedExecution(Runnable r, ThreadPoolExecutor executor) void
    }
    
    class CallerRunsPolicy {
        +rejectedExecution(Runnable r, ThreadPoolExecutor executor) void
    }
    
    class DiscardPolicy {
        +rejectedExecution(Runnable r, ThreadPoolExecutor executor) void
    }
    
    class DiscardOldestPolicy {
        +rejectedExecution(Runnable r, ThreadPoolExecutor executor) void
    }
    
    %% ========== 实现层 - ScheduledThreadPoolExecutor ==========
    class ScheduledThreadPoolExecutor {
        -delayedWorkQueue: DelayedWorkQueue
        -removeOnCancel: boolean
        +schedule(Runnable command, long delay, TimeUnit unit) ScheduledFuture~?~
        +schedule(Callable~V~ callable, long delay, TimeUnit unit) ScheduledFuture~V~
        +scheduleAtFixedRate(Runnable command, long initialDelay, long period, TimeUnit unit) ScheduledFuture~?~
        +scheduleWithFixedDelay(Runnable command, long initialDelay, long delay, TimeUnit unit) ScheduledFuture~?~
        +decorateTask(Runnable runnable, RunnableScheduledFuture~?~ task) RunnableScheduledFuture~?~
        +decorateTask(Callable~V~ callable, RunnableScheduledFuture~V~ task) RunnableScheduledFuture~V~
        +setRemoveOnCancelPolicy(boolean removeOnCancel) void
        note: "基于DelayQueue的延迟调度"
    }
    
    class ScheduledFutureTask {
        -time: long
        -sequenceNumber: long
        -period: long
        -outerTask: RunnableScheduledFuture~V~
        +run() void
        +runAndReset() boolean
        +isPeriodic() boolean
        +getDelay(TimeUnit unit) long
        +compareTo(Delayed other) int
        -setNextRunTime() void
        -reExecutePeriodic(RunnableScheduledFuture~?~ task) void
        note: "period>0:固定频率;period<0:固定延迟"
    }
    
    class DelayedWorkQueue {
        -queue: RunnableScheduledFuture~?~[]
        -size: int
        -leader: Thread
        -lock: ReentrantLock
        -available: Condition
        +offer(RunnableScheduledFuture~?~ e) boolean
        +take() RunnableScheduledFuture~?~
        +poll() RunnableScheduledFuture~?~
        +poll(long timeout, TimeUnit unit) RunnableScheduledFuture~?~
        +peek() RunnableScheduledFuture~?~
        +size() int
        +clear() void
        note: "堆实现+leader机制"
    }
    
    class Delayed {
        <<interface>>
        +getDelay(TimeUnit unit) long
    }
    
    %% ========== 实现层 - ForkJoinPool ==========
    class ForkJoinPool {
        -parallelism: int
        -workQueues: WorkQueue[]
        +execute(ForkJoinTask~?~ task) void
        +submit(ForkJoinTask~T~ task) ForkJoinTask~T~
        +invoke(ForkJoinTask~T~ task) T
        note: "工作窃取:双端队列(LIFO/FIFO)"
    }
    
    class ForkJoinWorkerThread {
        -pool: ForkJoinPool
        -workQueue: WorkQueue
        +run() void
        +onStart() void
        +onTermination(Throwable exception) void
    }
    
    class WorkQueue {
        -array: ForkJoinTask~?~[]
        -base: int
        -top: int
        -ctl: int
        -pool: ForkJoinPool
        -owner: ForkJoinWorkerThread
        +push(ForkJoinTask~?~ task) int
        +pop() ForkJoinTask~?~
        +poll() ForkJoinTask~?~
        +tryUnpush(ForkJoinTask~?~ task) boolean
        +growArray() ForkJoinTask~?~[]
        note: "array容量8192起,base/top无锁"
    }
    
    class ForkJoinTask {
        <<abstract>>
        -status: int
        +fork() ForkJoinTask~T~
        +join() T
        +invoke() T
        +tryUnfork() boolean
        +quietlyComplete() void
        note: "增强Future:fork/join语义+工作窃取支持"
    }
    
    class RecursiveTask {
        <<abstract>>
        +compute() V
    }
    
    class RecursiveAction {
        <<abstract>>
        +compute() void
    }
    
    class CountedCompleter {
        <<abstract>>
        -completer: CountedCompleter~?~
        -pending: int
        +compute() void
        +onCompletion(CountedCompleter~?~ caller) void
        +tryComplete() void
        +propagateCompletion() void
        +addToPendingCount(int delta) void
        note: "JDK8 Stream并行实现的核心载体"
    }
    
    class Runnable {
        <<interface>>
        +run() void
    }
    
    %% ========== 继承关系（放在类定义之后）==========
    Executor <|-- ExecutorService
    ExecutorService <|-- ScheduledExecutorService
    ExecutorService <|-- AbstractExecutorService
    AbstractExecutorService <|-- ThreadPoolExecutor
    AbstractExecutorService <|-- ForkJoinPool
    ThreadPoolExecutor <|-- ScheduledThreadPoolExecutor
    
    Future <|-- RunnableFuture
    RunnableFuture <|.. FutureTask
    Future <|-- ForkJoinTask
    Future <|-- ScheduledFuture
    RunnableScheduledFuture --|> ScheduledFuture
    RunnableScheduledFuture --|> Runnable
    ScheduledFutureTask ..|> RunnableScheduledFuture
    Delayed <|.. ScheduledFutureTask
    
    ForkJoinTask <|-- RecursiveTask
    ForkJoinTask <|-- RecursiveAction
    ForkJoinTask <|-- CountedCompleter
    
    RunnableFuture --|> Runnable
    
    RejectedExecutionHandler <|.. AbortPolicy
    RejectedExecutionHandler <|.. CallerRunsPolicy
    RejectedExecutionHandler <|.. DiscardPolicy
    RejectedExecutionHandler <|.. DiscardOldestPolicy
    
    %% ========== 组合关系 ==========
    AbstractExecutorService ..> FutureTask : creates
    ThreadPoolExecutor o-- Worker : manages
    ThreadPoolExecutor --> RejectedExecutionHandler : uses
    ThreadPoolExecutor --> ThreadFactory : uses
    
    ScheduledThreadPoolExecutor o-- ScheduledFutureTask : manages
    ScheduledThreadPoolExecutor --> DelayedWorkQueue : uses
    
    ForkJoinPool o-- ForkJoinWorkerThread : manages
    ForkJoinWorkerThread --> WorkQueue : owns
    WorkQueue --> ForkJoinTask : stores
    
    Executors ..> ThreadPoolExecutor : creates
    Executors ..> ScheduledThreadPoolExecutor : creates
    Executors ..> ForkJoinPool : creates
    
    %% ========== 工具类 ==========
    class Executors {
        <<utility>>
        +newFixedThreadPool(int nThreads) ExecutorService
        +newCachedThreadPool() ExecutorService
        +newSingleThreadExecutor() ExecutorService
        +newScheduledThreadPool(int corePoolSize) ScheduledExecutorService
        +newWorkStealingPool() ExecutorService
        +defaultThreadFactory() ThreadFactory
        note: "工厂方法(已不推荐)"
    }
    
    class TimeUnit {
        <<enum>>
        NANOSECONDS
        MICROSECONDS
        MILLISECONDS
        SECONDS
        +toNanos(long d) long
        +toMillis(long d) long
        +sleep(long timeout) void
    }

父子孙

从上述类图可提炼出清晰的继承层次：

ThreadPoolExecutor 与 ForkJoinPool 是兄弟关系，都继承自 AbstractExecutorService
ScheduledThreadPoolExecutor 是 ThreadPoolExecutor 的子类，是 AbstractExecutorService 的孙子

Executor 接口

将任务提交和任务执行进行解耦（decoupling the execution mechanic）。用户无需关注如何创建线程，如何调度线程（scheduling）来执行任务，用户只需提供 Runnable 对象，将任务的运行逻辑提交到执行器(Executor)中，由 Executor 框架完成线程的调配和任务的执行部分。

JUC 里所有的解耦设计都不一定是异步的，它只是解耦，所以执行器本身也是可以同步执行的：

class DirectExecutor implements Executor {
    // 这个类型只有这一个核心方法
   public void execute(Runnable r) {
     r.run();
   }
 }

一般而言可以认为，executor 会 spawns a new thread for each task.

ExecutorService 接口

增加了一些能力：

扩充执行任务的能力，补充可以为一个或一批异步任务生成 Future 的方法（），从这里开始执行器开始可以执行异步任务：

// 立即返回:Future.get 不一定可用
// public Future<?> submit(Runnable task)
// 这个 api 是很神奇的，本质上 runnable 是没有返回值的，这相当于帮我们给一个 runnable 带上一个线程运行结束的结果
// public <T> Future<T> submit(Runnable task, T result)
// 立即返回:Future.get 已经可用(调用 get() 时才会阻塞直到任务完成)
// public <T> Future<T> submit(Callable<T> task)
// 执行并返回任意一个成功完成的任务结果
// <T> T invokeAny(Collection<? extends Callable<T>> tasks) throws InterruptedException, ExecutionException
// 执行并返回任意一个成功完成的任务结果(带超时)
// <T> T invokeAny(Collection<? extends Callable<T>> tasks, long timeout, TimeUnit unit) throws InterruptedException, ExecutionException, TimeoutException
// 执行所有任务并返回结果列表
// <T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks) throws InterruptedException
// 执行所有任务并返回结果列表(带超时)
// <T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks, long timeout, TimeUnit unit) throws InterruptedException

在上面的方法里，submit 能接收无结果的 Runnable、有结果的 Runnable、能返回结果的 Callable，再加上底层无返回结果的 execute，构成了4个基础的单任务api。

ExecutorService 还提供了管控线程池的方法，比如停止线程池的运行。详见后续章节对 shutdown() 和 shutdownNow() 的详细分析。

线程池的拒绝策略与线程中断机制

线程池通过 拒绝策略（Rejection Policy）和线程中断（Thread Interruption） 两种机制来处理任务提交失败和线程池关闭场景。

拒绝策略触发场景

拒绝策略通过 RejectedExecutionHandler 接口实现，在以下场景触发：

触发场景	触发时机	调用位置	说明
线程池饱和	核心线程数已满 + 队列已满 + 达到最大线程数	`execute()` 步骤3失败	无法创建新线程处理任务
线程池关闭后提交	调用 `shutdown()` 或 `shutdownNow()` 后	`execute()` 步骤1检查	状态 >= SHUTDOWN 时拒绝新任务
Worker 创建失败	ThreadFactory 返回 null 或线程启动失败	`addWorker()` 失败后	无法创建工作线程

代码示例：

ThreadPoolExecutor executor = new ThreadPoolExecutor(
    1, 1,  // corePoolSize=1, maximumPoolSize=1
    0L, TimeUnit.MILLISECONDS,
    new ArrayBlockingQueue<>(1),  // 队列容量=1
    new ThreadPoolExecutor.AbortPolicy()
);

// 任务1：占用唯一的核心线程
executor.execute(() -> {
    try { Thread.sleep(1000); } catch (InterruptedException e) {}
});

// 任务2：进入队列
executor.execute(() -> System.out.println("task 2"));

// 任务3：触发拒绝策略（线程池饱和）
try {
    executor.execute(() -> System.out.println("task 3"));
} catch (RejectedExecutionException e) {
    System.err.println("任务被拒绝: " + e.getMessage());
}

// 关闭线程池
executor.shutdown();

// 任务4：触发拒绝策略（线程池已关闭）
try {
    executor.execute(() -> System.out.println("task 4"));
} catch (RejectedExecutionException e) {
    System.err.println("任务被拒绝: " + e.getMessage());
}

线程中断触发场景

线程中断用于通知线程检查状态或终止执行，ThreadPoolExecutor 中的线程中断触发场景如下：

触发场景	方法调用	中断范围	目的
显式关闭（优雅）	`shutdown()`	仅空闲线程	让空闲线程检查池状态后退出，正在执行的任务不受影响。这一段不需要业务代码响应中断，只要 runWorker 内部的 take/pol 的响应中断机制和对中断异常的处理就透明地处理这些中断，空闲线程自然退出死亡
显式关闭（强制）	`shutdownNow()`	所有线程（包括执行中）	立即中断所有线程，尝试停止正在执行的任务。需要业务代码能够响应中断。
传播式关闭	`tryTerminate()`	一个空闲线程	终止条件满足但仍有线程时，中断一个空闲线程形成连锁反应
配置变更	`setCorePoolSize()` 等	空闲线程	参数调小后回收多余的空闲线程
任务取消	`Future.cancel(true)`	执行该任务的线程	用户主动取消任务

关键区别：

// shutdown(): 优雅关闭
executor.shutdown();
// 1. 状态: RUNNING → SHUTDOWN
// 2. 拒绝新任务（触发 RejectedExecutionException）
// 3. 中断所有空闲线程（调用 interruptIdleWorkers()）
// 4. 继续处理队列中的任务
// 5. 所有任务完成后进入 TERMINATED 状态

// shutdownNow(): 强制关闭
List<Runnable> unfinished = executor.shutdownNow();
// 1. 状态: RUNNING → STOP
// 2. 拒绝新任务（触发 RejectedExecutionException）
// 3. 中断所有线程（包括正在执行任务的，调用 interruptWorkers()）
// 4. 清空队列并返回未执行的任务
// 5. 不等待任务完成，直接进入 TERMINATED 状态

常见误解澄清：

误解	真相
❌ `awaitTermination()` 超时会中断线程	✅ 只是等待方法返回 false，不会触发任何中断
❌ 周期任务异常会中断线程	✅ 任务静默终止，线程继续存活处理其他任务
❌ 线程池饱和会中断线程	✅ 触发拒绝策略，不会中断已存在的线程
❌ `tryTerminate()` 会中断所有线程	✅ 只中断一个空闲线程，通过传播式关闭逐步终止

最佳实践：

// 优雅关闭模式（推荐）
executor.shutdown();  // 停止接收新任务
try {
    // 等待已提交任务完成（最多60秒）
    if (!executor.awaitTermination(60, TimeUnit.SECONDS)) {
        // 超时后强制关闭
        executor.shutdownNow();
        // 再等待一段时间确保线程响应中断
        if (!executor.awaitTermination(60, TimeUnit.SECONDS)) {
            System.err.println("线程池未能正常终止");
        }
    }
} catch (InterruptedException e) {
    // 当前线程被中断，强制关闭线程池
    executor.shutdownNow();
    // 恢复中断状态
    Thread.currentThread().interrupt();
}

AbstractExecutorService

将执行任务的流程串联起来，保证下层实现只需关注 execute() 方法：

大部分任务接口在这一层有了实现，最终都调向 execute()
生命周期接口留给下层实现

详细实现原理（newTaskFor 工厂方法、任务包装机制、模板方法模式）见 AbstractExecutorService 详解章节。

ThreadPoolExecutor

实现了 execute，围绕 execute 的批量和异步化给出了一个经典的线程池执行器实现。

将会一方面维护自身的生命周期，另一方面同时管理线程（Thread）和任务（Task，也就是 Runnable），使两者良好的结合从而执行并行任务。

execute 的三段式判断体现了生产者-消费者解耦模型：当 workerCount < corePoolSize 时创建核心线程，任务作为 firstTask 直接传递给 Worker；当队列未满时入队等待，阻塞队列成为生产者与消费者之间的桥梁；当核心线程数已满、队列已满（入队失败）且 workerCount < maximumPoolSize时创建非核心线程，同样以 firstTask 方式传递。无论哪种路径，真正的消费者都是 Worker 线程的 runWorker 循环——它先消费 firstTask，后续通过 getTask() 从队列持续消费。

ThreadPoolExecutor运行流程.png

ScheduledExecutorService 接口

ScheduledExecutorService 扩展了 ExecutorService 接口，专门用于支持延迟执行和周期性执行的任务调度。

// ========== 一次性延迟执行 ==========
// 延迟执行 Runnable 任务（无返回值）
// public ScheduledFuture<?> schedule(Runnable command, long delay, TimeUnit unit)
// 延迟执行 Callable 任务（有返回值）
// public <V> ScheduledFuture<V> schedule(Callable<V> callable, long delay, TimeUnit unit)

// ========== 周期性执行 ==========
// 固定频率执行（从上次任务开始计时）
// public ScheduledFuture<?> scheduleAtFixedRate(Runnable command, long initialDelay, long period, TimeUnit unit)
// 固定延迟执行（从上次任务完成计时）
// public ScheduledFuture<?> scheduleWithFixedDelay(Runnable command, long initialDelay, long delay, TimeUnit unit)

两种周期模式的时间计算差异：

方法	时间计算基准	任务耗时 > period 时的行为	适用场景
`scheduleAtFixedRate`	上次开始时间 + period	等待完成后立即执行下一次（追赶）	心跳检测、定时采样
`scheduleWithFixedDelay`	上次完成时间 + delay	严格保证任务间隔	任务队列处理、限流场景

scheduleAtFixedRate(period=1s) 执行时间轴：
|----- delay -----|--- period ---|--- period ---|--- period ---|
                      [task1]       [task2]       [task3]
语义：尝试按固定频率触发，若任务耗时超过 period 则完成后立即追赶

scheduleWithFixedDelay(delay=1s) 执行时间轴：
|----- delay -----|--- task ---|--- delay ---|--- task ---|
                      [task1]       [task2]
语义：每次完成后等待固定延迟再执行，严格保证任务间隔

示例：delay=1s，任务执行0.5s → 每1.5秒执行一次；任务执行2s → 每3秒执行一次

核心特性：

支持一次性延迟执行
支持固定频率/固定延迟两种周期模式
返回 ScheduledFuture 用于任务控制和结果获取

实现类：

ScheduledThreadPoolExecutor 是主要实现
内部使用 DelayedWorkQueue（基于二叉堆的优先级队列）
任务通过 ScheduledFutureTask 封装，支持时间管理和周期计算

详细说明：关于内部实现机制、核心组件架构、任务调度原理等内容，请参阅第2章《ScheduledThreadPoolExecutor 详解》。

ScheduledThreadPoolExecutor 对 ThreadPoolExecutor 的扩展

ScheduledExecutorService 接口定义了定时调度的契约，而 ScheduledThreadPoolExecutor 是其主要实现。其类声明体现了双重设计：

1
2
3

public class ScheduledThreadPoolExecutor
        extends ThreadPoolExecutor
        implements ScheduledExecutorService

这形成了一个清晰的扩展层次：

接口层：ScheduledExecutorService 扩展 ExecutorService，新增定时调度契约
实现层：ScheduledThreadPoolExecutor 继承 ThreadPoolExecutor，复用线程池核心能力

核心扩展点：

扩展维度	ThreadPoolExecutor	ScheduledThreadPoolExecutor
队列	外部传入 `BlockingQueue`	强制使用 `DelayedWorkQueue`（二叉堆）
任务封装	`FutureTask`	`ScheduledFutureTask`（新增 time/period 字段）
execute()	直接入队执行	重写为 `schedule(command, 0, NANOSECONDS)`
submit()	通过 execute()	同样走 schedule(0) 路径
新增方法	无	schedule 系列、setRemoveOnCancelPolicy、decorateTask

设计要点：

队列强制绑定：构造器不接受外部队列参数，在 super() 调用中硬编码 DelayedWorkQueue
任务周期管理：ScheduledFutureTask 通过 period 字段区分一次性任务（0）、fixed-rate（正数）、fixed-delay（负数）
线程池复用：完全继承 ThreadPoolExecutor 的 Worker 管理、状态机、拒绝策略机制

Worker 机制复用解析：延时线程池确实能够完全复用 ThreadPoolExecutor 的 Worker 机制，关键在于队列的阻塞语义。Worker 线程的 getTask() 方法调用 queue.take() 获取任务，而 DelayedWorkQueue.take() 会阻塞直到队首任务到期。Worker 线程对此完全无感知——它只是在队列上等待，取到任务后执行。换言之，延时逻辑封装在队列层而非 Worker 层，这正是 ThreadPoolExecutor 将队列设计为可扩展组件的精妙之处：通过替换队列实现，无需修改 Worker 代码即可支持延时调度。

TPE 扩展边界：要扩展 ThreadPoolExecutor，能够扩展的只有队列、线程工厂、拒绝策略以及 RunnableFuture/FutureTask 任务。Worker 控制了主循环（runWorker() 中的 while 循环），其行为是固定的：取任务→执行任务→循环。真正的扩展点在 ftask.run() 调用处——即任务执行环节。decorateTask() 方法正是为此设计，允许子类包装任务对象，在 run() 方法前后插入自定义逻辑，调用自定义线程池重调度方法，这也是 ScheduledThreadPoolExecutor 实现周期调度的关键机制。

任务提交路径：ScheduledThreadPoolExecutor 的 execute() 和 schedule() 都没有调用父类的 execute()。execute() 被重写为 schedule(command, 0, NANOSECONDS)，而 schedule() 内部通过 delayedExecute() 直接调用 super.getQueue().add(task) 向队列投递任务，并调用 ensurePrestart() 确保有线程运行。这跳过了 ThreadPoolExecutor 原生的入队逻辑，强制所有任务走 DelayedWorkQueue。

生产者-消费者解耦：Worker 线程的运行与 execute()/schedule() 是解耦的。后者只是生产者，向队列投递任务；Worker 线程一旦启动，就在 runWorker() 的 while 循环中自主运行，通过 getTask() 从队列消费任务。两者通过队列连接，互不直接驱动。

任务分配机制：多个 Worker 线程同时阻塞在 queue.take() 或 queue.poll() 上。当任务入队后，哪个线程被唤醒并获取任务由阻塞队列的锁竞争和操作系统线程调度决定，而非 Java 层面的随机分配。以 DelayedWorkQueue 为例，其 take() 方法使用 ReentrantLock 保护，任务出队需要获取这把锁——竞争成功的线程获得任务，其他线程继续阻塞或重试。这是竞争性分配而非随机分配。
API 兼容：execute/submit 语义保持不变，内部转换为即时调度

API 主次之分：从设计意图看，execute() 和 submit() 都是通过 schedule(0) 路径实现的，本质上是"延时为 0 的调度"，只是延时封装下的立即执行。真正体现 ScheduledExecutorService 定时调度能力的核心 API 是 schedule()、scheduleAtFixedRate() 和 scheduleWithFixedDelay()，而后者两个周期调度方法永远不会被传统的 AbstractExecutorService 体系（execute/submit/invokeAll/invokeAny）调用。

继承关系：

ExecutorService ←─ ScheduledExecutorService（接口扩展：新增 schedule 系列）
       ↑                        ↑
       │                        │
ThreadPoolExecutor ←─ ScheduledThreadPoolExecutor（类继承：复用 + 扩展）

ForkJoinPool

这个线程池本身就是一个复杂框架，为 JDK 其他组件提供 yet another executor alternative。

这个框架有个特点：

产生的线程默认是守护线程，其他线程池产生的默认不是守护线程。
产生的线程会自动收缩-不存在空转的 core thread 问题。
公共线程池的名字一般叫“ForkJoinPool.commonPool-worker-1”。

这里就要讨论到一个很多人忽略的问题：我们如何决定何时使用守护类线程。这类线程可以用来执行一些：

临时执行的任务，这些任务之间如果存在父子关系更好。
后台监控类任务。
可以被中断的计算任务。

规范说明：根据Java Language Specification §12.8，守护线程的关键特性是"不阻止JVM退出"。因此判断是否使用守护线程的标准应该是：

任务是否可以在JVM退出时被安全中断

任务是否需要确保完成（如数据持久化、事务提交）

任务失败是否可以接受或能够重试恢复

典型的工作线程池包括两类：
- IO线程池：平台线程池的一种，专门处理IO密集型任务（如文件读写、网络请求），通常使用固定大小的线程池（如FixedThreadPool，本质是 ThreadPoolExecutor 的封装）。
- 计算线程池：平台线程池的一种，专门处理CPU密集型任务（如数值计算、数据处理），可使用ForkJoinPool等工作窃取线程池。

初始化这类线程池有一些简单的工厂方法，比原始构造器更加可用：Executors.newWorkStealingPool(int parallelism)，其余工厂方法见后文。

ForkJoinPool 概述：

ForkJoinPool 是 Java 7 引入的另一种 ExecutorService 实现，与 ThreadPoolExecutor 走了完全不同的设计路线。它的核心特性包括：

工作窃取（Work-Stealing）：每个工作线程拥有独立的双端队列（Deque），空闲线程会主动从繁忙线程的队列中"窃取"任务，实现自动负载均衡。
分治并行（Fork/Join）：天然支持递归任务分解，通过 ForkJoinTask（RecursiveTask/RecursiveAction）实现分治算法。
asyncMode 参数：控制工作队列的调度模式——LIFO（默认，适合递归分治）或 FIFO（适合事件驱动场景）。
固定并行度：线程数通常等于 CPU 核心数，不像 ThreadPoolExecutor 那样动态扩缩容。

特性关系澄清：

这四个特性中，工作窃取是 ForkJoinPool 的核心基础设施，无论选择哪种 asyncMode 或任务类型，工作窃取机制都始终启用。工作窃取是调度层面的机制（如何分发任务），分治并行是任务层面的模式（如何分解任务），两者是正交关系——工作窃取可服务于非分治任务（如 newWorkStealingPool() 处理普通并行任务），分治算法理论上也可使用其他调度机制。在 ForkJoinPool 的实现中，工作窃取是分治并行的底层支撑，但这不代表两者在概念上存在从属关系。

JDK 提供了两种常用的获取方式：

ForkJoinPool.commonPool()：全局共享的 ForkJoinPool 实例，parallelStream() 和 CompletableFuture 默认使用。
Executors.newWorkStealingPool(int parallelism)：创建独立的工作窃取线程池。

关于 ForkJoinPool 的 asyncMode 参数详解、工作窃取机制原理、与 ThreadPoolExecutor 的核心差异对比、commonPool 的任务排队机制等深入内容，详见 ForkJoinPool 详解：分治并行的执行引擎章节。

小结

本章介绍了 Java 线程池的核心接口体系，遵循“契约层 → 模板层 → 实现层 → 工厂层”的设计脉络：

契约层：Executor → ExecutorService → ScheduledExecutorService，逐层扩展执行、生命周期、定时调度契约（详见上文各接口章节）
模板层：AbstractExecutorService 为 submit/invokeAll/invokeAny 提供默认实现，下层只需实现 execute()（详见 AbstractExecutorService 详解）
实现层：ThreadPoolExecutor（经典线程池）、ScheduledThreadPoolExecutor（定时调度）、ForkJoinPool（工作窃取）
工厂层：Executors 静态工厂方法集合（如 newFixedThreadPool、newCachedThreadPool、newWorkStealingPool）

AbstractExecutorService 详解

AbstractExecutorService 将执行任务的流程串联起来，保证下层实现只需关注 execute() 方法。这一层的大部分方法实现遵循以下模式：

把任务包装成 FutureTask
用 execute 执行这个 FutureTask
返回 FutureTask 实例供调用者使用

newTaskFor：任务包装的核心工厂方法

newTaskFor 是 AbstractExecutorService 的核心工厂方法，它负责将用户提交的任务（Runnable 或 Callable）包装成 RunnableFuture，默认返回 FutureTask 实例，但子类可以 override 提供自定义实现。关于 FutureTask 的内部结构（callable/outcome/run 的同级关系、状态机、RunnableAdapter 适配器等），详见 ThreadPoolExecutor 如何管理任务章节。

方法签名

// AbstractExecutorService.java
/**
 * 为给定的 Callable 任务返回一个 RunnableFuture
 * @param callable 有返回值的任务
 * @return 包装后的 RunnableFuture
 */
protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable);

/**
 * 为给定的 Runnable 任务返回一个 RunnableFuture。
 * @param runnable 无返回值的任务
 * @param value 任务完成后的返回值（可为 null）
 * @return 包装后的 RunnableFuture
 */
protected <T> RunnableFuture<T> newTaskFor(Runnable runnable, T value);

Runnable 变成 Future，总要配一个 Value，这是一个好的设计模式。

封装关系：把什么东西封装成什么东西？

// 1. Callable<T> -> FutureTask<T>
Callable<String> callable = () -> "Hello";
RunnableFuture<String> future = newTaskFor(callable);
// 封装关系：Callable 被封装为 FutureTask
// - Callable.call() 提供计算逻辑
// - FutureTask 提供 Future 接口（get()、cancel() 等）
// - FutureTask 同时实现 Runnable，可以提交给 execute()

// 2. Runnable + T -> FutureTask<T>
Runnable runnable = () -> System.out.println("Task");
String result = "Done";
RunnableFuture<String> future = newTaskFor(runnable, result);
// 封装关系：Runnable + result 被封装为 FutureTask
// - Runnable.run() 提供执行逻辑
// - result 提供"虚拟"返回值
// - FutureTask 提供 Future 接口

默认实现

// AbstractExecutorService 的默认实现
protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable) {
    return new FutureTask<T>(callable);
}

protected <T> RunnableFuture<T> newTaskFor(Runnable runnable, T value) {
    return new FutureTask<T>(runnable, value);
}

为什么需要 newTaskFor？

解耦任务类型：
- 用户提交的是 Callable<T> 或 Runnable
- Executor 接收的是 Runnable
- Future 接口提供 get() 获取结果
- newTaskFor 将这三者统一起来
支持自定义扩展：
子类可以重写 newTaskFor 来添加自定义逻辑：

// 自定义实现示例：添加 RPC 上下文传递
@Override
protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable) {
    // 闭包写法：声明在方法体中，被匿名类捕获为 effectively final 变量
    // Object rpcContext = RpcContext.getCurrent();
    return new FutureTask<T>(callable) {
        // 实例字段写法：声明为匿名类成员，初始化时机同样是 newTaskFor 调用时
        // 两种写法执行时机相同，都会被编译器处理为匿名类的成员字段
        private final Object rpcContext = RpcContext.getCurrent();
        
        @Override
        public void run() {
            // run() 在工作线程执行，通过实例字段访问提交时保存的上下文
            RpcContext.set(rpcContext);
            try {
                super.run();
            } finally {
                RpcContext.clear();
            }
        }
    };
}

统一任务包装：
所有高级方法都依赖 newTaskFor：

// submit() 的实现
public <T> Future<T> submit(Callable<T> task) {
    if (task == null) throw new NullPointerException();
    RunnableFuture<T> ftask = newTaskFor(task);  // 使用 newTaskFor
    execute(ftask);                                // 提交给 execute
    return ftask;                                  // 返回 Future
}

// invokeAll() 的实现
public <T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks) {
    if (tasks == null) throw new NullPointerException();
    List<Future<T>> futures = new ArrayList<Future<T>>(tasks.size());
    boolean done = false;
    try {
        for (Callable<T> t : tasks) {
            RunnableFuture<T> f = newTaskFor(t);  // 使用 newTaskFor
            futures.add(f);
            execute(f);
        }
       // 正确
    } catch (Exception e) {
        // 异常处理
    }
}

// invokeAny() 的实现（简化）
public <T> T invokeAny(Collection<? extends Callable<T>> tasks)
    throws InterruptedException, ExecutionException {
    // 内部使用 ExecutorCompletionService 追踪完成顺序
    ExecutorCompletionService<T> ecs = new ExecutorCompletionService<T>(this);
    try {
        // 提交所有任务
        for (Callable<T> t : tasks)
            ecs.submit(t);  // 内部调用 newTaskFor + execute
        // 轮询等待任意一个任务成功完成
        for (int i = 0; i < tasks.size(); ++i) {
            Future<T> f = ecs.take();  // 阻塞等待下一个完成的任务
            try {
                return f.get();  // 成功则直接返回结果，不返回 Future
            } catch (ExecutionException eex) {
                // 该任务失败，继续等待下一个
            }
        }
        throw new ExecutionException("No task completed successfully", null);
    } finally {
        // 取消所有未完成的任务
        cancelAll(futures);
    }
}

invokeAny 为什么返回 T 而不是 Future？

与 submit 和 invokeAll 不同，invokeAny 直接返回结果值 T。这源于语义差异：

submit/invokeAll：提交任务后立即返回，调用者稍后通过 Future 获取结果——返回时任务可能未完成
invokeAny：阻塞等待任意一个任务成功完成——返回时结果已确定，不存在"未来"需要等待

如果 invokeAny 返回 Future<T>，调用者必然要调用 get()，而此时 Future 已完成，这层包装毫无价值。直接返回 T 简化了 API 使用，符合"最少意外原则"。

这三个方法的实现透露了得到 future 的诀窍：因为 execute 返回 void，所以要保存 newTaskFor 的返回值引用，然后调用 execute 执行。可以说凡是需要 execute 的最底层，要得到 Future 都需要抓住 newTaskFor 的返回值。

像 invokeAll 和 submit 只是"封装 + execute"的门面，在创建 FutureTask 后、调用 execute 前，有机会对 FutureTask 进行额外处理（如加入列表追踪、设置超时等）。

封装的核心价值

输入	封装过程	输出	价值
`Callable<T>`	`newTaskFor()`	`FutureTask<T>`	获得异步结果获取能力
`Runnable` + `T`	`newTaskFor()`	`FutureTask<T>`	无返回值任务也能返回结果
计算逻辑	包装为 `Runnable` + `Future`	可提交、可等待	统一的异步编程模型

设计模式：工厂方法模式

classDiagram
    class AbstractExecutorService {
        <<abstract>>
        #newTaskFor(Callable~T~) RunnableFuture~T~
        #newTaskFor(Runnable, T) RunnableFuture~T~
        +submit(Callable~T~) Future~T~
        +invokeAll(...) List~Future~T~~
    }
    
    class ThreadPoolExecutor {
        #newTaskFor(Callable~T~) RunnableFuture~T~
        #newTaskFor(Runnable, T) RunnableFuture~T~
    }
    
    class CustomExecutor {
        #newTaskFor(Callable~T~) RunnableFuture~T~
    }
    
    class RunnableFuture {
        <<interface>>
        +run() void
    }
    
    class Future~T~ {
        <<interface>>
    }
    
    class FutureTask {
        +run()
        +get() T
        +cancel()
    }
    
    RunnableFuture --|> Future : extends
    AbstractExecutorService <|-- ThreadPoolExecutor
    AbstractExecutorService <|-- CustomExecutor
    AbstractExecutorService ..> RunnableFuture : creates via
    FutureTask ..|> RunnableFuture : implements

要点

newTaskFor 是连接"同步任务"和"异步执行"的桥梁：

它将计算任务（Callable/Runnable）封装为可执行可等待的对象（FutureTask）
它是 AbstractExecutorService 所有高级方法的基础
它提供了扩展点，允许子类自定义任务包装逻辑，我们常见的自定义 traceId 传递的 newTask 匿名类内部，都有使用扩展的 FutureTask。
它体现了"模板方法模式"：定义算法骨架，子类实现具体步骤

FutureTask：任务包装的标准实现

类型体系与设计定位

FutureTask 是 Java 并发框架中「可取消的异步计算」的核心实现（@since 1.5, @author Doug Lea）。它实现了 RunnableFuture<V> 接口，而 RunnableFuture 同时继承了 Runnable 和 Future——这两个接口一个面向线程池（对内执行），一个面向任务调用方（对外获取结果）。FutureTask 是 RunnableFuture 的两个经典实现之一（All Known Implementing Classes: FutureTask, SwingWorker），可以认为它是可执行 Future 的最忠实实现。

classDiagram
    class FutureTask {
        -callable: Callable~V~
        -outcome: Object
        -state: int
        -runner: Thread
        -waiters: WaitNode
        
        +run() void
        +get() V
        +cancel(boolean) boolean
        +isDone() boolean
    }
    note for FutureTask "@since 1.5"
    
    class RunnableFuture {
        <<interface>>
        +run() void
    }
    note for RunnableFuture "@since 1.6"
    
    class Runnable {
        <<interface>>
        +run() void
    }
    note for Runnable "@since 1.0"
    
    class Future {
        <<interface>>
        +get() V
        +cancel(boolean) boolean
        +isDone() boolean
    }
    note for Future "@since 1.5"
    
    class Callable {
        <<interface>>
        +call() V
    }
    note for Callable "@since 1.5"
    
    FutureTask ..|> RunnableFuture : implements
    RunnableFuture --|> Runnable : extends
    RunnableFuture --|> Future : extends
    FutureTask o-- Callable : has
    FutureTask o-- Object : stores
    FutureTask o-- Thread : references

FutureTask 本身不是 Callable，但包含 Callable。它的双重身份是设计的关键：

作为 Runnable：可以被提交给 Executor 执行
作为 Future：提供结果获取、取消、状态查询能力

核心语义约束：

单次执行原则：任务只能执行一次，一旦进入终态（NORMAL/EXCEPTIONAL/CANCELLED/INTERRUPTED）就不可重启。
阻塞语义：get() 在任务完成前会阻塞调用线程，这是 Future 模式的核心价值。
不可逆取消：一旦取消成功，任务即使尚未开始也不会再执行。
runAndReset 是例外：专为周期性任务设计，执行后重置状态但不设置结果。

执行环境无关性：FutureTask 的 run()、runAndReset() 及其状态机设计与执行环境完全解耦。不假定调用者是 ThreadPoolExecutor 的 Worker、用户线程还是 main 线程；不区分同步调用、异步提交或定时调度。runner = Thread.currentThread() 的语义是“谁调用就记录谁”，状态转换完全自包含，不依赖外部线程池状态。这是典型的关注点分离设计：FutureTask 只负责状态管理、结果存储、等待/唤醒协调，线程池只负责线程管理和任务调度，两者通过 Runnable 接口解耦。

/**
 * A cancellable asynchronous computation.  This class provides a base
 * implementation of {@link Future}, with methods to start and cancel
 * a computation, query to see if the computation is complete, and
 * retrieve the result of the computation.  The result can only be
 * retrieved when the computation has completed; the {@code get}
 * methods will block if the computation has not yet completed.  Once
 * the computation has completed, the computation cannot be restarted
 * or cancelled (unless the computation is invoked using
 * {@link #runAndReset}).
 *
 * <p>A {@code FutureTask} can be used to wrap a {@link Callable} or
 * {@link Runnable} object.  Because {@code FutureTask} implements
 * {@code Runnable}, a {@code FutureTask} can be submitted to an
 * {@link Executor} for execution.
 *
 * <p>In addition to serving as a standalone class, this class provides
 * {@code protected} functionality that may be useful when creating
 * customized task classes.
 *
 * @since 1.5
 * @author Doug Lea
 * @param <V> The result type returned by this FutureTask's {@code get} methods
 */
public class FutureTask<V> implements RunnableFuture<V> {
}

Javadoc 释义：

「cancellable asynchronous computation」：FutureTask 的核心定位是可取消的异步计算单元。

「base implementation of Future」：提供 Future 接口的基础实现，子类可扩展。

「get methods will block」：阻塞是获取异步结果的代价，这是 Future 模式的本质特征。

「wrap a Callable or Runnable」：适配器模式，统一两种任务类型-通过两种构造器的形式。实际上只能wrap一个 Callable，Runnable 必须适配成 Callable 放进来。

「protected functionality」：模板方法模式，done() 等钩子供子类定制。

成员字段与构造

FutureTask 有 5 个一级成员字段，它们之间构成了一个典型的「输入 → 执行 → 输出」模型：

FutureTask<V>
├── callable: Callable<V>      // 输入：持有待执行的任务
├── outcome: Object            // 输出：存储执行结果或异常
├── state: int                 // 控制：状态机
├── runner: Thread             // 控制：执行线程引用
└── waiters: WaitNode          // 控制：等待线程的 Treiber 栈

run() 方法的核心职责就是调用 callable.call() 获取返回值，然后通过 set(result) 将结果写入 outcome。callable 是输入，run() 是执行器（内建），outcome 是输出（内建）。

/** The underlying callable; nulled out after running */
// 任务进入终态后 callable 会被置空-所以任务绝对不可重复执行，帮助 GC
private Callable<V> callable;

/** The result to return or exception to throw from get() */
// 异常和结果使用同一个 outcome，所以 outcome 不能是泛型，必须是 Object。
// 它是非 volatile 的，可见性通过 state 的 volatile 读写来保证（[volatile 捎带同步](/2026/02/07/JVM-的内存模型与线程/#7-1-volatile-的捎带同步（Piggybacking）)）：
// 1. outcome = v happens-before state = NORMAL（程序顺序规则）
// 2. state = NORMAL happens-before 读取 state（volatile 规则）
// 3. 因此，outcome = v happens-before 读取 outcome（传递性）
private Object outcome; // non-volatile, protected by state reads/writes

/** The thread running the callable; CASed during run() */
// 持有执行线程引用，用于 cancel(true) 时中断执行线程。
// 语义精确性：runner != null 表示有线程正在执行 run() 方法体（从 CAS 成功到 finally 清空），
// 但不等价于 callable.call() 正在执行，可能处于 call() 前、call() 中、或 set()/setException() 执行期间。这是嵌套任务的必然设计，FutureTask 的状态是大于 callable 的状态的。
private volatile Thread runner;

/** Treiber stack of waiting threads */
// 管理阻塞在 get() 上的等待线程，使用无锁并发栈（Treiber Stack）-当我们park里线程又需要 unpark 线程的时候，需要记录等待线程
private volatile WaitNode waiters;

FutureTask 提供两个构造器，支持 Callable 和 Runnable 两种任务类型。构造器中 state = NEW 写在最后，利用 volatile 捎带同步保证 callable 的可见性：

public FutureTask(Callable<V> callable) {
    if (callable == null)
        throw new NullPointerException();
    this.callable = callable;
    this.state = NEW;       // ensure visibility of callable。以后 get 值以前要先 check state 就可以
}

public FutureTask(Runnable runnable, V result) {
    this.callable = Executors.callable(runnable, result);
    this.state = NEW;       // ensure visibility of callable
}

当传入 Runnable 时，线程池使用 RunnableAdapter 将其适配为 Callable：

// Executors.callable() 的适配逻辑
static final class RunnableAdapter<T> implements Callable<T> {
    final Runnable task;
    final T result;
    RunnableAdapter(Runnable task, T result) {
        this.task = task;
        this.result = result;
    }
    // 实现类可以不声明接口方法的受检异常
    public T call() {
        // 可以看出，task 的run 不能修改 result，所以把 runnable 封装成计算式的 callable 是不现实的
        task.run();
        return result;
    }
}

这形成了清晰的封装层次：FutureTask.run() → callable.call()（可能是 RunnableAdapter.call()，也可能是普通的callable.call()）→ task.run() → return result 设置 outcome → report outcome。整个链路将无返回值的 Runnable 转换为有返回值的 Future 模式。之所以这样设计，本质上是因为 Thread 类底层只支持 run()，不支持 call()。FutureTask 是能让 runnable 内部含有结果，而且可以借助一个输出接口输出结果的经典范例。

同级封装适配的设计动因：

方向	机制	核心约束	设计要点
Callable → Runnable	FutureTask（实质上是 RunnableFuture）	run() 是 void，无法返回值	run() 内部调用 call()，将返回值存入 outcome，通过 get() 暴露。get() 是带有延时和状态检查的 call()：call() 立即执行并返回，get() 等待状态机达到终态后才返回 outcome
Runnable → Callable	RunnableAdapter（实质上是 Callable）	run() 无返回值，无法产出计算结果	只能提供预设的 result，call() 执行 run() 后直接返回预设值。若需计算结果，应直接使用 Callable

简言之：Callable 封装成 Runnable 需要一个中间层（FutureTask-RunnableFuture）来“接住”返回值；Runnable 适配成 Callable 只能「带着结果进去」，无法「计算出结果」。

状态机

state 字段是 FutureTask 的核心状态机，使用 volatile int 而非枚举类型——这是 Doug Lea 的常见设计风格，核心考量是：配合 UNSAFE.compareAndSwapInt 实现无锁状态转换，volatile 保证可见性，整数比较性能更高。

/**
 * The run state of this task, initially NEW.  The run state
 * transitions to a terminal state only in methods set,
 * setException, and cancel.  During completion, state may take on
 * transient values of COMPLETING (while outcome is being set) or
 * INTERRUPTING (only while interrupting the runner to satisfy a
 * cancel(true)). Transitions from these intermediate to final
 * states use cheaper ordered/lazy writes because values are unique
 * and cannot be further modified.
 *
 * Possible state transitions:
 * NEW -> COMPLETING -> NORMAL
 * NEW -> COMPLETING -> EXCEPTIONAL
 * NEW -> CANCELLED
 * NEW -> INTERRUPTING -> INTERRUPTED
 */
// 核心状态机字段，volatile 保证多线程可见性，配合 CAS 实现无锁状态转换。
// 设计动因：使用 int 而非枚举，因为需要配合 UNSAFE.compareAndSwapInt 进行原子操作。
private volatile int state;
// NEW(0)：初始态，任务尚未执行或正在执行中，是唯一可被 cancel 的状态
private static final int NEW          = 0;
// COMPLETING(1)：瞬态，call() 已返回，正在写入 outcome，持续时间极短
private static final int COMPLETING   = 1;
// NORMAL(2)：终态，任务正常完成，outcome 存储返回值
private static final int NORMAL       = 2;
// EXCEPTIONAL(3)：终态，任务异常完成，outcome 存储 Throwable
private static final int EXCEPTIONAL  = 3;
// CANCELLED(4)：终态，任务被 cancel(false) 取消，未触发中断
private static final int CANCELLED    = 4;
// INTERRUPTING(5)：瞬态，cancel(true) 正在中断 runner 线程
private static final int INTERRUPTING = 5;
// INTERRUPTED(6)：终态，cancel(true) 完成，runner 已被中断
private static final int INTERRUPTED  = 6;

Javadoc 释义：

「initially NEW」：构造后初始状态为 NEW(0)，这是唯一可以接受任务取消的状态

「terminal state」：终态包括 NORMAL/EXCEPTIONAL/CANCELLED/INTERRUPTED，不可逆转

「transient values」：COMPLETING/INTERRUPTING 是瞬态，主要用于设置 outcome 或执行中断的窗口期

「ordered/lazy writes」：使用 UNSAFE.putOrderedInt 而非 volatile 写，因为终态唯一不可变

putOrderedInt 语义详解：putOrderedInt 是弱化版 volatile 写（又称 lazySet）。与 putIntVolatile 的区别在于内存屏障：

方法	写前屏障	写后屏障
`putIntVolatile`	StoreStore	StoreLoad
`putOrderedInt`	StoreStore	无

为什么叫 “ordered”：保证 store-store ordering，此写操作之前的所有写不会被重排序到此写之后（如 outcome = v 必然先于 state = NORMAL）。

为什么叫 “lazy”：省略了写后的 StoreLoad 屏障，写入可能滞留在 CPU 写缓冲区，其他线程最终会看到但不保证立即可见。在 x86 上，putOrderedInt 编译为普通 MOV 指令，而 putIntVolatile 需要 LOCK 前缀或 MFENCE。

适用场景：只需 happens-before 传递性不需即时可见性时使用。FutureTask 终态写入正是此场景：读到终态的线程必能读到 outcome，但不要求终态立即被观测到。JDK 9+ 的 VarHandle.setRelease() 是其替代 API。

FutureTask 状态转换图：

stateDiagram-v2
    [*] --> NEW: 任务创建
    
    NEW --> COMPLETING: call()执行完成
    NEW --> CANCELLED: cancel(false)
    NEW --> INTERRUPTING: cancel(true)
    
    COMPLETING --> NORMAL: 正常结果设置完成
    COMPLETING --> EXCEPTIONAL: 异常结果设置完成
    
    INTERRUPTING --> INTERRUPTED: 中断完成
    
    NORMAL --> [*]: 终态
    EXCEPTIONAL --> [*]: 终态
    CANCELLED --> [*]: 终态
    INTERRUPTED --> [*]: 终态
    
    note right of NEW: 初始状态，任务可被取消
    note right of COMPLETING: 瞬态，正在设置结果
    note right of INTERRUPTING: 瞬态，正在中断runner

值得一提的是，任务的中间状态是一个瞬态，它非常的短暂。而且任务的中间态并不代表任务正在执行，而是任务已经执行完了，正在设置最终的返回结果，所以可以这么说：
只要 state 不处于 NEW 状态，就说明任务已经执行完毕。
注意，这里的执行完毕是指传入的 Callable 对象的 call 方法执行完毕，或者抛出了异常。所以这里的 COMPLETING 的名字显得有点迷惑性，它并不意味着任务正在执行中，而意味着 call 方法已经执行完毕，正在设置任务执行的结果。

换言之，只有 NEW 状态才是 cancellable 的。

状态查询方法：

public boolean isCancelled() {
    return state >= CANCELLED;
}

// 只要不是 NEW 就算完成——包括过渡态（COMPLETING/INTERRUPTING），即使结果还不可用
// 注意：isDone()=true 不等于 get() 可立即返回，过渡态下仍需等待
public boolean isDone() {
    return state != NEW;
}

执行入口：run() 与 runAndReset()

run()

state == NEW 检查与 CAS 绑定 runner 共同保证 FutureTask 最多执行一次。

run() 是任务执行的入口-通常由线程池的 worker 调用，worker 最终也成为 runner。核心流程：state 检查 + CAS 绑定 runner 保证幂等 → 执行 callable.call() → 根据结果调用 set() 或 setException()（内部 CAS NEW→COMPLETING 进入中间态，再转为终态，这个转换在一个方法里全部完成，所以中间态是很短暂的）→ finally 中置空 runner 并处理可能的中断。

public void run() {
    // 这是一个需要反向理解的幂等保证：只有 state == NEW 且 CAS 成功绑定 runner 才执行
    if (state != NEW ||
        !UNSAFE.compareAndSwapObject(this, runnerOffset,
                                     null, Thread.currentThread()))
        return;
    try {
        Callable<V> c = callable;
        if (c != null && state == NEW) {
            V result;
            // ran 是一个局部变量
            boolean ran;
            try {
                result = c.call();
                ran = true;
            } catch (Throwable ex) {
                result = null;
                ran = false;
                setException(ex);    // NEW → COMPLETING → EXCEPTIONAL
            }
            // 为何不在 try 块内直接调用 set()?
            // set() 内部的 finishCompletion() 会唤醒等待线程、执行回调，理论上可能抛异常
            // 若在 try 块内抛出，会被 catch(Throwable) 捕获并触发 setException()
            // 任务明明成功了却被标记为失败——这是错误的
            // 用 ran 标志位退出 catch 块后再调用，确保异常边界清晰
            if (ran)
                set(result);         // NEW → COMPLETING → NORMAL
        }
    } finally {
        // runner 必须在状态确定后才能置空，防止并发调用 run()
        runner = null;
        // 置空 runner 后必须重读 state，防止泄漏中断
        int s = state;
        if (s >= INTERRUPTING)
            handlePossibleCancellationInterrupt(s);
    }
}

runner 的生命周期

runner 字段记录了正在执行任务的线程引用，它的注入和使用流程如下：

sequenceDiagram
    participant Caller as 调用方线程
    participant Pool as 线程池
    participant FutureTask
    participant Worker as 线程池Worker
    
    Caller->>Pool: submit(task)
    Pool->>FutureTask: new FutureTask(task)
    Note right of FutureTask: state = NEW, runner = null
    Pool-->>Caller: return futureTask
    
    Worker->>FutureTask: run()
    FutureTask->>FutureTask: CAS设置 runner = Worker
    Note right of FutureTask: Worker执行 callable.call()
    
    Caller->>FutureTask: cancel(true)
    FutureTask->>FutureTask: CAS NEW→INTERRUPTING
    FutureTask->>Worker: runner.interrupt()
    FutureTask->>FutureTask: state = INTERRUPTED
    FutureTask->>FutureTask: finishCompletion()
    
    Note over Worker: Worker收到中断信号
    Worker->>FutureTask: run()的finally块
    FutureTask->>FutureTask: runner = null
    FutureTask->>FutureTask: handlePossibleCancellationInterrupt()
    Note right of FutureTask: 若state==INTERRUPTING则自旋等待

FutureTask 只执行一次，执行完成（无论成功、异常还是取消）后，runner 字段会被置为 null。

Thread.start → Worker.run → runWorker → FutureTask.run 调用关系辨析

线程池中任务的执行涉及多个层次的 run 方法调用，理解它们的包含关系是掌握线程池执行模型的关键。

调用链：

Thread.start()                        // JVM 层面：启动新线程
    → Thread.run()                    // Thread 类：调用 target.run()
        → Worker.run()                // Worker 类：【委托】→ runWorker(this)
            → ThreadPoolExecutor.runWorker()  // TPE：任务调度循环
                → task.run()          // 具体任务：可能是 FutureTask
                    → FutureTask.run()        // FutureTask：状态管理 + callable.call()
                        → callable.call()     // 用户代码：实际业务逻辑

Note:
  - Worker.run() 委托给外部类的 runWorker(this)，类似 Visitor 双分派模式
  - runWorker() 负责任务调度全流程：循环获取任务（firstTask 或 getTask()）、AQS 加锁保护执行、beforeExecute/afterExecute 生命周期钩子、异常捕获与 processWorkerExit() 退出处理
  - FutureTask.run() 提供完整包装：幂等保证（state == NEW 检查 + CAS 绑定 runner）、状态转换（NEW → COMPLETING → NORMAL/EXCEPTIONAL）、结果/异常存储到 outcome、唤醒 get() 等待线程、清空 runner。

runAndReset()

runAndReset() 专为周期性任务设计（典型应用场景是 ScheduledThreadPoolExecutor 中的定时任务）。与 run() 的关键区别：

维度	`run()`	`runAndReset()`
结果设置	调用 `set(result)` 或 `setException(ex)` 清空 callable；runner 在 finally 块中清空	不设置结果，`get()` 永远阻塞或超时，无法获取中间结果。正常完成时不调用 `set()`，故不触发 `finishCompletion()`，callable 保留；runner 在 finally 块中清空
正常完成	NEW → NORMAL（终态）	状态保持 NEW，允许再次执行
异常/取消	进入终态	进入终态（与 `run()` 一致）
可重复执行	否	仅正常完成时可重复

/**
 * Executes the computation without setting its result, and then
 * resets this future to initial state, failing to do so if the
 * computation encounters an exception or is cancelled.  This is
 * designed for use with tasks that intrinsically execute more
 * than once.
 *
 * @return {@code true} if successfully run and reset
 */
// 核心职责：执行任务但不设置结果，正常完成时保持 NEW 状态以支持重复执行。
// 设计动因：专为周期性任务设计（如 ScheduledThreadPoolExecutor 的定时任务），
// 与 run() 的关键区别是不调用 set()，因此不会触发状态转换和 finishCompletion()。
protected boolean runAndReset() {
    // 幂等保证：state == NEW 且 CAS 绑定 runner 成功才能执行
    if (state != NEW ||
        !UNSAFE.compareAndSwapObject(this, runnerOffset,
                                     null, Thread.currentThread()))
        return false;
    boolean ran = false;
    int s = state;  // volatile 读，获取当前状态快照
    try {
        Callable<V> c = callable;
        // 双重检查：callable 非空且状态仍为 NEW（防止并发 cancel）
        if (c != null && s == NEW) {
            try {
                c.call(); // 执行但不保存结果——这是与 run() 的核心区别
                ran = true;
            } catch (Throwable ex) {
                // 异常时进入终态，后续不可重复执行
                setException(ex);
            }
        }
    } finally {
        // runner 必须在状态确定后才能置空，防止并发调用
        runner = null;
        // 重读 state：防止 cancel(true) 的中断信号泄漏
        s = state;
        if (s >= INTERRUPTING)
            handlePossibleCancellationInterrupt(s);
    }
    // 返回 true 条件：成功执行且状态仍为 NEW（未被 cancel 或异常）
    return ran && s == NEW;
}

Javadoc 释义：

「without setting its result」：执行但不产生可获取的结果

「resets this future to initial state」：重置的是状态而非 callable 引用

「failing to do so if…exception or cancelled」：异常和取消都会导致进入终态，不再可重置

「intrinsically execute more than once」：典型如定时任务、心跳任务等周期性场景

三类终态方法：set / setException / cancel

FutureTask 有三种进入终态的路径，它们都以 finishCompletion() 收尾：

set()：正常完成

状态转换：NEW → COMPLETING → NORMAL。CAS 先设置中间态 COMPLETING 防止并发取消，中间态期间写入 outcome（可见性由后续的 volatile state 写入保证），然后用 putOrderedInt（懒写）写入终态 NORMAL。

// 核心职责：将任务标记为正常完成，存储结果并唤醒等待线程。
// 状态转换：NEW → COMPLETING → NORMAL
protected void set(V v) {
    // CAS NEW→COMPLETING：抢占中间态，防止并发 cancel 或重复 set
    if (UNSAFE.compareAndSwapInt(this, stateOffset, NEW, COMPLETING)) {
        // CAS 失败时 outcome 丢失——这是设计折衷，cancel 优先级高于结果设置
        outcome = v;  // 非 volatile 写，可见性由后续 state 写入保证（volatile 捎带同步）
        // putOrderedInt：懒写终态，省略 StoreLoad 屏障，因为终态唯一不可变
        UNSAFE.putOrderedInt(this, stateOffset, NORMAL); // final state
        // 唤醒所有等待线程，执行 done() 回调，清空 callable
        finishCompletion();
    }
}

setException()：异常完成

状态转换：NEW → COMPLETING → EXCEPTIONAL。与 set() 几乎相同，但 outcome 存储的是 Throwable。如果 CAS 失败（已被 cancel），异常信息丢失，这是设计折衷。

// 核心职责：将任务标记为异常完成，存储异常并唤醒等待线程。
// 状态转换：NEW → COMPLETING → EXCEPTIONAL
protected void setException(Throwable t) {
    // CAS NEW→COMPLETING：与 set() 逻辑相同，抢占中间态
    if (UNSAFE.compareAndSwapInt(this, stateOffset, NEW, COMPLETING)) {
        // CAS 失败时异常信息丢失——若已被 cancel，调用方通过 CancellationException 感知
        outcome = t;  // outcome 复用存储异常，类型由 state 决定如何解释
        UNSAFE.putOrderedInt(this, stateOffset, EXCEPTIONAL); // final state
        finishCompletion();
    }
}

cancel()：取消/中断

从这个方法可以看出，中断也是 cancel 的一种。只能从 NEW 状态取消，返回 true 表示状态迁移成功，不保证任务实际停止。

public boolean cancel(boolean mayInterruptIfRunning) {
    // 只能从 NEW 迁移到 INTERRUPTING 或 CANCELLED。已经进入 COMPLETING 意味着 callable 已经执行完了，就不允许 cancel 任务了。如果迁移到 CANCELLED，下面的 try 语句的 if 也不会执行。
    if (!(state == NEW &&
          UNSAFE.compareAndSwapInt(this, stateOffset, NEW,
              mayInterruptIfRunning ? INTERRUPTING : CANCELLED)))
        return false;
    try {    // in case call to interrupt throws exception
        // 能走到这里，任务可能正在运行（runner != null）或尚未启动（runner == null）。
        // 若正在运行则中断执行线程；若尚未启动，runner 为 null 不执行 interrupt，
        // 但状态已迁移，后续 run() 会因 state != NEW 而直接返回。
        if (mayInterruptIfRunning) {
            try {
                // === TOCTOU（Time-of-Check to Time-of-Use）防护模式 ===
                // 问题背景：多线程环境下，"检查"和"使用"之间存在时间窗口，
                // 此窗口内状态可能被其他线程修改，导致检查结果失效。
                //
                // 本例中的竞态场景：
                // 线程A（本线程）          线程B（run方法执行线程）
                // ─────────────────────   ─────────────────────────
                // if (runner != null)      // 检查通过
                //                          finally { runner = null; }
                // runner.interrupt()      // NPE！runner已被置空
                //
                // 防护方案：将 volatile 字段快照到局部变量，保证检查和使用的是同一个引用。
                // 即使原字段随后被其他线程修改，局部变量仍持有旧引用，避免 NPE。
                //
                // 这是 JDK 并发代码标准模式，广泛用于：
                // - FutureTask.cancel()：快照 runner 字段
                // - ThreadPoolExecutor.execute()：快照 ctl 字段
                // - Reference.get()：快照 referent 字段
                // - StampedLock：快照 stamp 值
                Thread t = runner;
                if (t != null)
                    t.interrupt();
            } finally { // final state
                UNSAFE.putOrderedInt(this, stateOffset, INTERRUPTED);
            }
        }
    } finally {
        // 如果没有 mayInterruptIfRunning，其实只执行这里。收尾工作
        finishCompletion();
    }
    return true;
}

参数	状态转换	行为
`cancel(false)`	NEW → CANCELLED	仅标记取消，不中断执行线程
`cancel(true)`	NEW → INTERRUPTING → INTERRUPTED	标记取消并对 runner 线程调用 `interrupt()`

主动取消任务的 API 总览：

API	作用范围	行为
`Future.cancel(boolean)`	单任务级别	标记取消，可选中断执行线程
`shutdownNow()`	线程池级别	中断所有 Worker，队列任务作为返回值

其他如 shutdown() 是关闭线程池入口，不取消已提交任务；setRemoveOnCancelPolicy(true) 是 cancel() 的队列行为优化，非独立取消方式。

cancel(true) vs cancel(false) 的语义差异

Future.cancel(boolean mayInterruptIfRunning) 的语义：一个 Future 对应一个任务，参数决定对该任务如何处理。

任务状态	cancel(false)	cancel(true)
尚未开始	取消成功，不执行	取消成功，不执行
正在执行	不中断，让任务完成	调用 `Thread.interrupt()` 尝试中断

实践中的状态分布：在典型线程池场景中，"尚未开始"是一个非常短暂的时间窗口——除非任务在队列中排队，否则线程池有空闲线程时任务几乎立即被执行。因此，cancel(false) 与 cancel(true) 的核心差异几乎只体现在任务正在执行时。

// 优雅取消：不中断正在执行的任务
future.cancel(false);

// 强制取消：尝试中断正在执行的任务
future.cancel(true);

关键洞察：mayInterruptIfRunning 参数仅在任务正在执行时产生差异。任务未开始时，两参数效果相同；任务执行后，只有 cancel(true) 会额外设置中断标志。

重要注意：

中断只是设置中断标志，任务代码必须检查 Thread.interrupted() 或使用可中断方法才能真正终止
阻塞 IO、synchronized 锁等不一定响应中断
对于不可中断阻塞，需要使用底层超时机制（HTTP timeout、JDBC timeout 等）

cancel(true) 对线程池的影响：

cancel(true) 对线程池本身无直接影响——中断信号仅作用于任务内部逻辑，Worker 线程不会因此退出。原因如下：

FutureTask 是异常隔离层：无论 call() 抛出什么异常（包括 InterruptedException），都被捕获存储为 outcome，不会传播到 runWorker()，因此不会触发 processWorkerExit() 的异常退出路径。
线程池唯一感知的是 task.run() 的返回：正常返回则 Worker 继续循环获取下一个任务；抛出异常则可能触发线程补充机制。FutureTask 保证 task.run() 不抛异常。
中断依赖协作：如果 command 内部不检查中断标志、不调用可中断方法，cancel(true) 对任务行为无影响。

为何需要 INTERRUPTING 中间态？

cancel(true) 分两步：CAS 进入 INTERRUPTING → 执行 t.interrupt() → 设置 INTERRUPTED。若直接 CAS 到 INTERRUPTED，存在时序竞争：

线程A执行run()                          线程B执行cancel(true)
─────────────────────────────────────────────────────────────
                                        CAS NEW→INTERRUPTING ✓
                                        Thread t = runner (拿到线程A)
                                        ──被挂起──
callable.call() 完成
finally: runner = null
读取 state = INTERRUPTING
handlePossibleCancellationInterrupt()
  → 自旋等待 state 变为 INTERRUPTED
                                        ──恢复执行──
                                        t.interrupt()
                                        state = INTERRUPTED
run() 返回

若无 INTERRUPTING 中间态，run() 无法感知 cancel(true) 正在进行，可能在 t.interrupt() 执行前就返回，线程被复用执行新任务时收到这个“过期中断”——即中断泄漏。handlePossibleCancellationInterrupt() 通过自旋等待确保中断操作完成后 run() 才返回。

finishCompletion()：终态收尾

不管是正常完成/异常完成/取消，最终都一定要调用到这个方法。

所有终态方法最终都调用 finishCompletion()，它负责三件事：唤醒所有等待线程、调用 done() 钩子、置空 callable 帮助 GC。

/**
 * Removes and signals all waiting threads, invokes done(), and
 * nulls out callable.
 */
private void finishCompletion() {
    // 外层 for 循环：尝试获取等待队列的所有权
    // 这里用 for 而非 while，是为了在循环头部同时完成初始化和条件检查
    for (WaitNode q; (q = waiters) != null;) {
        // CAS 将 waiters 头指针置为 null，原子性地获取整个 Treiber 栈的所有权。
        // CAS 成功后，当前线程负责唤醒所有已入队的等待线程。
        // 新到达的等待线程会发现任务已进入终态，不会真正 park。
        // CAS 失败可能因为：(1) 新的等待线程入队导致栈头变化，或 (2) 另一终态方法已获取所有权。
        // 重新读取 waiters，若为 null 则退出，否则继续尝试。
        if (UNSAFE.compareAndSwapObject(this, waitersOffset, q, null)) {
            // 内层无限循环：遍历 Treiber 栈，逐个唤醒等待线程
            for (;;) {
                Thread t = q.thread;
                if (t != null) {
                    // 先置空 thread 引用，再唤醒
                    // 防止同一节点被重复处理（虽然当前场景不会发生，但是防御性编程）
                    q.thread = null;
                    // 唤醒等待线程，unpark 可以在 park 之前调用（permit 模型）
                    LockSupport.unpark(t);
                }
                WaitNode next = q.next;
                if (next == null)
                    break;         // 栈底，遍历结束
                q.next = null;     // 断开链表引用，帮助 GC 回收 WaitNode
                q = next;          // 移动到下一个节点
            }
            break;                 // CAS 成功并完成遍历，退出外层循环
        }
        // CAS 失败则重新读取 waiters，继续尝试
    }
    // 模板方法钩子，子类可重写以实现完成回调（如 SwingWorker 更新 UI）。但是默认实现为空
    done();
    // 置空 callable 减少内存占用，任务已完成，callable 不再需要
    callable = null;
}

LockSupport 补充：LockSupport 是 JUC 底层的线程阻塞/唤醒原语，基于许可证（permit）模型：park() 消费许可证（无则阻塞），unpark() 生产许可证（可提前发放，不可累加）。与 Object.wait/notify 的关键区别是无需持有监视器锁、unpark 可在 park 之前调用、不会抛出 InterruptedException。

结果获取：get() / awaitDone() / report()

get() 的逻辑分为两部分：阻塞等待交给 awaitDone()，结果解释交给 report()。

sequenceDiagram
    participant Caller as 调用方线程
    participant FutureTask
    participant WaitNode
    participant Runner as 执行线程(Worker)
    
    Caller->>FutureTask: get()
    FutureTask->>FutureTask: 检查 state <= COMPLETING?
    
    alt state > COMPLETING
        FutureTask->>FutureTask: report(state)
        FutureTask-->>Caller: 返回结果或抛出异常
    else state <= COMPLETING
        FutureTask->>FutureTask: awaitDone(timed, nanos)
        
        loop 多轮自旋
            Note over FutureTask: 检查中断状态
            alt 被中断
                FutureTask->>FutureTask: removeWaiter(q)
                FutureTask-->>Caller: 抛出 InterruptedException
            end
            
            alt state > COMPLETING
                FutureTask-->>FutureTask: 返回终态
            else state == COMPLETING
                FutureTask->>FutureTask: Thread.yield()
            else q == null
                FutureTask->>WaitNode: new WaitNode()
                Note right of WaitNode: 捕获当前线程引用
            else !queued
                FutureTask->>FutureTask: CAS 入栈(q.next=waiters, waiters=q)
            else
                FutureTask->>FutureTask: LockSupport.park(this)
                Note over FutureTask: 线程挂起等待唤醒
            end
        end
        
        Note over Runner: 任务执行完成
        Runner->>FutureTask: set(result) 或 setException(ex)
        FutureTask->>FutureTask: finishCompletion()
        
        loop 遍历 waiters 栈
            FutureTask->>WaitNode: 获取 thread 引用
            FutureTask->>Caller: LockSupport.unpark(thread)
        end
        
        Note over Caller: 被唤醒，继续自旋
        FutureTask->>FutureTask: 检测到 state > COMPLETING
        FutureTask-->>FutureTask: awaitDone 返回终态
        
        FutureTask->>FutureTask: report(state)
        alt state == NORMAL
            FutureTask-->>Caller: 返回 (V)outcome
        else state >= CANCELLED
            FutureTask-->>Caller: 抛出 CancellationException
        else state == EXCEPTIONAL
            FutureTask-->>Caller: 抛出 ExecutionException
        end
    end

public V get() throws InterruptedException, ExecutionException {
    int s = state;
    if (s <= COMPLETING)
        s = awaitDone(false, 0L);   // 无限等待
    return report(s);
}

public V get(long timeout, TimeUnit unit)
    throws InterruptedException, ExecutionException, TimeoutException {
    if (unit == null)
        throw new NullPointerException();
    int s = state;
    if (s <= COMPLETING &&
        (s = awaitDone(true, unit.toNanos(timeout))) <= COMPLETING)
        throw new TimeoutException();
    return report(s);
}

awaitDone()：自旋 + LockSupport.park 的阻塞等待

awaitDone 采用多轮自旋策略：第一轮创建 WaitNode，第二轮 CAS 入队，第三轮开始 park。中断时清除中断位并抛出 InterruptedException，超时后清理节点并返回当前状态。唤醒由 finishCompletion() 中的 LockSupport.unpark() 触发。

/**
 * Awaits completion or aborts on interrupt or timeout.
 *
 * <p>核心职责：阻塞当前线程直到任务完成、中断或超时。
 * 设计动因：采用多轮自旋而非直接 park，是因为每轮自旋都会重新检查 state，
 * 可在 COMPLETING 瞬态时遇到的短暂调度延迟内快速返回，避免不必要的线程挂起/唤醒开销。
 *
 * @param timed true if use timed waits。timed=true 表示限时等待
 * @param nanos time to wait, if timed。最大等待纳秒数
 * @return state upon completion。任务终态（NORMAL/EXCEPTIONAL/CANCELLED/INTERRUPTED），
 *         调用方据此决定 report() 路径
 * @throws InterruptedException 中断时立即抛出，符合 JUC 可中断等待的标准契约
 */
private int awaitDone(boolean timed, long nanos)
    throws InterruptedException {
    final long deadline = timed ? System.nanoTime() + nanos : 0L;
    WaitNode q = null;
    boolean queued = false;
    for (;;) {
        // 中断检查只针对当前调用 get() 的线程——每个等待线程独立响应自己的中断信号，
        // 被中断时只清理自己的 WaitNode 并抛出异常，不影响其他等待线程。
        // 响应中断：清空中断位，移除等待节点，抛出异常。任何一轮循环开始都可能被中断，在此插入对中断的处理。
        if (Thread.interrupted()) {
            removeWaiter(q);
            throw new InterruptedException();
        }

        int s = state;
        if (s > COMPLETING) {
            // 已进入终态，清空当前节点的 thread 引用即可
            if (q != null)
                q.thread = null;
            return s;
        }
        else if (s == COMPLETING)
            // COMPLETING 是瞬态，让出 CPU 等一下即可
            Thread.yield();
        else if (q == null)
            // 否则，state == NEW 但尚未入栈，开始准备长期等待（分两轮完成入栈）
            // 第一轮：创建 WaitNode，捕获当前 get 线程
            q = new WaitNode();
        else if (!queued)
            // 第二轮：CAS 入栈（头插法，新节点成为 waiters 头指针）
            queued = UNSAFE.compareAndSwapObject(this, waitersOffset,
                                                 q.next = waiters, q);
        else if (timed) {
            nanos = deadline - System.nanoTime();
            if (nanos <= 0L) {
                removeWaiter(q);
                return state;
            }
            LockSupport.parkNanos(this, nanos);
        }
        else
            // 无限驻留，直到 finishCompletion 中 unpark 唤醒
            LockSupport.park(this);
    }
}

WaitNode：Treiber Stack 节点

WaitNode 是用于记录等待 get() 结果的线程的单向链表节点，组织成 Treiber Stack（无锁并发栈）。

为什么需要 waiters/WaitNode：一个 FutureTask 可能被多个线程同时调用 get()，这些线程都会通过 LockSupport.park() 阻塞等待结果。JUC 的设计约束是：每个 park() 点都必须有对应的 unpark() 路径，否则线程会永久阻塞。因此 FutureTask 必须记录所有等待线程的引用，确保任务完成时 finishCompletion() 能遍历并 unpark() 每一个。详见《Java 并发编程笔记·JUC 的统一阻塞原语》。

为什么不用 AQS 而选择 Treiber Stack：

维度	AQS CLH Queue 变种	FutureTask Treiber Stack
结构	双向链表（prev + next）	单向链表（仅 next）
入队顺序	FIFO（先入先出）	LIFO（后入先出）
节点摘除	支持任意节点 cancel 后摘除（需 prev 指针回溯）	不支持中间节点摘除（只标记 thread=null）
内存开销	较高（每节点 2 个指针 + waitStatus）	较低（每节点 1 个指针）
适用场景	锁竞争（需公平性、可取消）	结果等待（无公平性要求、节点数少）

为什么 AQS 是 CLH 的「变种」：经典 CLH 是单向链表 + 自旋，AQS 改为双向链表 + park/unpark，因为需要支持取消语义——取消的节点必须物理摘除，否则后续节点无法被唤醒。核心差异：AQS 是「传递唤醒」（中间断链会死锁），FutureTask 是「广播唤醒」（跳过无效节点即可）。详见AQS CLH Queue 与 FutureTask Treiber Stack 对比。

/**
 * Simple linked list nodes to record waiting threads in a Treiber
 * stack.  See other classes such as Phaser and SynchronousQueue
 * for more detailed explanation.
 *
 * <p>设计动因：轻量级无锁栈节点，避免引入 AQS 等待队列的内存开销。
 * Treiber Stack 采用头插法 + CAS 实现无锁并发入栈，适合高争用场景。
 */
static final class WaitNode {
    // 等待线程引用，finishCompletion() 中 unpark 的目标。
    // volatile 保证可见性：入栈线程写入后，finishCompletion 线程能立即读取。
    // 任务完成后置 null，帮助 GC 回收。
    volatile Thread thread;
    // 栈中下一个节点（指向栈底方向）。
    // volatile 保证多线程 CAS 入栈时链表结构的可见性。
    volatile WaitNode next;
    // 构造器捕获当前调用 get() 的线程，记录“谁在等待”。
    WaitNode() { thread = Thread.currentThread(); }
}

removeWaiter()：清理超时/中断的等待节点

移除因超时或中断而不再等待的节点。先置空 thread 标记为"待删除"，然后遍历链表跳过这些节点。头节点用 CAS，内部节点直接修改 next 指针（因为 finishCompletion() 会跳过 thread == null 的节点，所以并发遍历无害）。

/**
 * Tries to unlink a timed-out or interrupted wait node to avoid
 * accumulating garbage.  Internal nodes are simply unspliced
 * without CAS since it is harmless if they are traversed anyway
 * by releasers.  To avoid effects of unsplicing from already
 * removed nodes, the list is retraversed in case of an apparent
 *
 * <p>移除因超时或中断而不再等待的节点。先置空 thread 标记为"待删除"，
 * 然后遍历链表跳过这些节点。头节点用 CAS，内部节点直接修改 next 指针
 * （因为 {@code finishCompletion()} 会跳过 {@code thread == null} 的节点，
 * 所以并发遍历无害）。
 *
 * <p>核心职责：从 Treiber Stack 中移除超时或被中断的等待节点，避免内存泄漏。
 * 设计动因：等待线程因超时/中断退出时，其 WaitNode 仍在栈中，需主动清理。
 * 并发安全策略：头节点用 CAS 移除，内部节点直接修改 next（因为 finishCompletion
 * 遍历时会跳过 thread==null 的节点，所以并发修改无害）。
 *
 * race.  This is slow when there are a lot of nodes, but we don't
 * expect lists to be long enough to outweigh higher-overhead
 * schemes.
 */
private void removeWaiter(WaitNode node) {
    if (node != null) {
        // 第一步：标记节点为「待删除」，置空 thread 引用
        node.thread = null;
        // 外层循环：检测到并发冲突时从头重新遍历
        retry:
        for (;;) {
            // 内层循环：遍历链表，pred 记录前驱，q 是当前节点，s 是后继
            for (WaitNode pred = null, q = waiters, s; q != null; q = s) {
                s = q.next;  // 先保存后继，因为 q 可能被移除
                if (q.thread != null)
                    // 节点有效，更新前驱指针继续遍历
                    pred = q;
                else if (pred != null) {
                    // 内部节点待删除：直接修改前驱的 next 跳过当前节点
                    pred.next = s;
                    // TOCTOU 防护：若前驱也被并发标记为待删除，需重新遍历
                    if (pred.thread == null)
                        continue retry;
                }
                else if (!UNSAFE.compareAndSwapObject(this, waitersOffset,
                                                      q, s))
                    // 头节点待删除：CAS 更新 waiters 指针，失败则重试
                    continue retry;
            }
            break;  // 遍历完成，退出
        }
    }
}

report()：终态到返回值/异常的转换

report() 根据终态将 outcome 解释为结果或异常。outcome 是 Object 类型，可能是结果 V 或 Throwable，由 state 决定如何解释。类型安全由状态机保证。

// 核心职责：根据终态将 outcome 解释为结果或异常，是 get() 的最终出口。
// 设计动因：outcome 是 Object 类型，可能是结果 V 或 Throwable，
// 类型安全由状态机保证——只有 NORMAL 时才强转为 V，EXCEPTIONAL 时才强转为 Throwable。
@SuppressWarnings("unchecked")
private V report(int s) throws ExecutionException {
    Object x = outcome;  // 此时 state 已是终态，outcome 可见性由 volatile state 读保证
    if (s == NORMAL)
        return (V)x;  // 正常完成：返回结果
    if (s >= CANCELLED)
        // 取消/中断：抛出 CancellationException（无需 outcome，因为取消无结果）
        // 注意：此异常在 get() 调用时才抛出，而非 cancel() 时。
        // cancel() 只设置状态位，延迟异常模式允许调用方选择是否感知取消。
        // 与 afterExecute(Throwable t) 无关——afterExecute 捕获的是 task.run() 向外抛出的异常，
        // 而 FutureTask.run() 不向外抛异常，CancellationException 仅在此处（get() 调用链）产生。
        throw new CancellationException();
    // 异常完成：包装为 ExecutionException，表明错误来自任务内部而非线程池
    throw new ExecutionException((Throwable)x);
}

终态	report() 行为	调用方感知
NORMAL	返回 `(V)outcome`	正常获取结果
EXCEPTIONAL	抛出 `ExecutionException((Throwable)outcome)`	`catch (ExecutionException)`
CANCELLED / INTERRUPTED	抛出 `CancellationException`	`catch (CancellationException)`

FutureTask 在线程池中的调用链路

每个线程池的 Worker 管理的实质上是 FutureTask。一个标准的可执行可等待任务是一个 RunnableFuture<V>，用成员变量来帮助 Runnable 保存一个 Callable 的返回值，以供 Future 使用。以 invokeAll 为例，完整的调用链路如下：

sequenceDiagram
    participant User
    participant AbstractExecutorService
    participant ThreadPoolExecutor
    participant WorkerThread
    participant FutureTask
    
    User->>AbstractExecutorService: invokeAll(tasks)
    loop for each task
        AbstractExecutorService->>AbstractExecutorService: newTaskFor(task)
        AbstractExecutorService->>FutureTask: new FutureTask(task)
        AbstractExecutorService->>ThreadPoolExecutor: execute(futureTask)
        ThreadPoolExecutor->>WorkerThread: 分配任务
        WorkerThread->>FutureTask: futureTask.run()
        FutureTask->>FutureTask: callable.call()
        FutureTask->>FutureTask: set(result)
    end
    
    AbstractExecutorService->>AbstractExecutorService: for each future: future.get()
    loop for each future
        AbstractExecutorService->>FutureTask: future.get()
        alt 任务已完成
            FutureTask-->>AbstractExecutorService: 立即返回结果
        else 任务未完成
            FutureTask-->>FutureTask: 挂起等待
            FutureTask->>FutureTask: 任务完成后唤醒
            FutureTask-->>AbstractExecutorService: 返回结果
        end
    end
    
    AbstractExecutorService-->>User: 返回所有Future结果

invokeAll

invokeAll 是有界的-有界来源于底层的 execute 是有界的，如果一次性提交了超过它界限的任务，即使这些任务是一瞬间执行的-invokeAll 也会触发拒绝，除非任务执行的速度比 for 循环调用底层的 execute 的速度还要快。

如果有得选，我们批量执行任务应该尽量采用 invokeAll，因为它带有这些特殊的代码块：

public <T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks,
                                         long timeout, TimeUnit unit)
        throws InterruptedException {
        if (tasks == null)
            throw new NullPointerException();
        long nanos = unit.toNanos(timeout);
        ArrayList<Future<T>> futures = new ArrayList<Future<T>>(tasks.size());
        boolean done = false;
        try {
            for (Callable<T> t : tasks)
                futures.add(newTaskFor(t));

            final long deadline = System.nanoTime() + nanos;
            final int size = futures.size();

            // Interleave time checks and calls to execute in case
            // executor doesn't have any/much parallelism.
            // 释义：交替进行超时检查和任务提交，以防执行器没有足够的并行度。
            // 设计意图：如果线程池并行度很低（如单线程池），需要在提交每个任务后检查是否已超时，
            // 否则可能在所有任务提交完成前就已经超时了。
            for (int i = 0; i < size; i++) {
                // invokeAll 的有界性源于 execute 的有界性（队列容量 + 线程数上限 + 拒绝策略）
                execute((Runnable)futures.get(i));
                nanos = deadline - System.nanoTime();
                if (nanos <= 0L)
                    return futures;
            }

            for (int i = 0; i < size; i++) {
                Future<T> f = futures.get(i);
                if (!f.isDone()) {
                    if (nanos <= 0L)
                        return futures;
                    try {
                        // 等待任务完成，get() 可多次调用返回相同结果
                        f.get(nanos, TimeUnit.NANOSECONDS);
                    } catch (CancellationException ignore) {
                    } catch (ExecutionException ignore) {
                    } catch (TimeoutException toe) {
                        return futures;
                    }
                    nanos = deadline - System.nanoTime();
                }
            }
            done = true;
            return futures;
        } finally {
            if (!done)
                for (int i = 0, size = futures.size(); i < size; i++)                
                    // 我们不鼓励 cancel java 线程，但是可以，而且鼓励 cancel Future
                    futures.get(i).cancel(true);
        }
    }

sequenceDiagram
    participant Caller as 调用方
    participant AES as AbstractExecutorService
    participant TPE as ThreadPoolExecutor
    participant FT as FutureTask[]

    Caller->>AES: invokeAll(tasks, timeout)
    
    rect rgb(240, 248, 255)
        Note over AES: 第一阶段：包装任务
        loop 遍历 tasks
            AES->>FT: newTaskFor(callable)
        end
    end
    
    rect rgb(255, 248, 240)
        Note over AES: 第二阶段：提交任务（有界性来源）
        loop 遍历 futures
            AES->>TPE: execute(futureTask)
            Note right of TPE: 队列满则触发拒绝策略
            AES->>AES: 检查超时
            alt 已超时
                AES-->>Caller: return futures（部分未提交）
            end
        end
    end
    
    rect rgb(240, 255, 240)
        Note over AES: 第三阶段：等待完成
        loop 遍历 futures
            AES->>FT: f.get(remaining, NANOSECONDS)
            alt 超时
                AES-->>Caller: return futures（部分未完成）
            end
        end
    end
    
    AES->>AES: done = true
    AES-->>Caller: return futures（全部完成）
    
    Note over AES: finally: if (!done) cancel 所有任务

两种针对 Runnable 的 submit

// 普通 submit(Runnable) - Future.get() 返回 null
Future<?> future3 = executor.submit(() -> System.out.println("普通任务"));
Object result3 = future3.get(); // result3 == null

// submit(Runnable, T result) - Future.get() 返回指定的结果
Future<String> future4 = executor.submit(() -> System.out.println("带结果的任务"), "自定义结果");
String result4 = future4.get(); // result4 == "自定义结果"

这里面使用到了2种适配器：

用户层：需要 submit(Runnable, T result) 这样的高级API
       ↓
适配层：RunnableAdapter 提供语义适配
       ↓  
执行层：FutureTask 提供接口适配  
       ↓
基础层：ThreadPoolExecutor 只认 execute(Runnable)

底层的 execute 本身要求一个包含 callable + result 的 runnbale - FutureTask（向底层的 execute api 适配，向外提供 Future 的 get、cancel 等能力），但是这样的 callable 最初又要经过 RunnableAdapter 从 Runnable 得来（向上向原始的没有返回值的 Runnable 适配）。

可以认为，RunnableAdapter 是一个对象适配器，原始类型是 Runnable，目标类型是 Callable。

我们得到一个 Runnable，要先经过 RunnableAdapter 转成普通 Callable，然后再经 FutureTask 转成 RunnableFuture。

两类底层调用链：

// 底层调用链
// 1. submit(callable) → new FutureTask(callable)
// 2. execute(futureTask) → futureTask.run()
// 3. futureTask.run() → callable.call() → return 42
// 4. future.get() → 42

// 底层调用链
// 1. submit(runnable, result) → Executors.callable(runnable, result) 
//   → new RunnableAdapter(runnable, result)
// 2. new FutureTask(runnableAdapter) 
//   → futureTask内部持有runnableAdapter
// 3. execute(futureTask) → futureTask.run()
// 4. futureTask.run() → runnableAdapter.call()
// 5. runnableAdapter.call() → runnable.run() + return successMessage
// 6. future.get() → successMessage

sequenceDiagram
    participant Caller as 调用方
    participant AES as AbstractExecutorService
    participant RA as RunnableAdapter
    participant FT as FutureTask
    participant TPE as ThreadPoolExecutor

    rect rgb(240, 248, 255)
        Note over Caller,TPE: 路径一：submit(Callable)
        Caller->>AES: submit(callable)
        AES->>FT: new FutureTask(callable)
        AES->>TPE: execute(futureTask)
        TPE->>FT: futureTask.run()
        FT->>FT: callable.call()
        Caller->>FT: future.get()
        FT-->>Caller: 返回 callable 的结果
    end

    rect rgb(255, 248, 240)
        Note over Caller,TPE: 路径二：submit(Runnable, result)
        Caller->>AES: submit(runnable, result)
        AES->>RA: Executors.callable(runnable, result)
        Note right of RA: RunnableAdapter 封装
        AES->>FT: new FutureTask(runnableAdapter)
        AES->>TPE: execute(futureTask)
        TPE->>FT: futureTask.run()
        FT->>RA: runnableAdapter.call()
        RA->>RA: runnable.run()
        RA-->>FT: return result
        Caller->>FT: future.get()
        FT-->>Caller: 返回预设的 result
    end

至此，我们已经理解了执行器体系的继承关系、任务包装机制和调用链路。

ThreadPoolExecutor

前置知识：本节内容依赖对 ThreadPoolExecutor 内部状态机制的理解。如对状态体系不熟悉，请先阅读核心架构：ctl 与线程池状态机章节。

核心架构：ctl 与线程池状态机

在深入 ThreadPoolExecutor 的状态维护机制之前，有必要先厘清线程池体系中涉及的多层状态体系。线程池架构中存在 4 层独立但相互关联的状态体系：

状态体系	层级	状态数量	状态类型	核心作用
ThreadPoolExecutor 生命周期状态	池级别	5 种	RUNNING → SHUTDOWN/STOP → TIDYING → TERMINATED	控制线程池整体生命周期
Worker 锁状态	工作线程级别	3 种	-1 / 0 / 1	保护任务执行期间的中断控制（-1 是 Worker 自定义的初始化状态，0/1 是 AQS 标准锁状态）
Java Thread 状态	原生线程级别	6 种	NEW / RUNNABLE / BLOCKED / WAITING / TIMED_WAITING / TERMINATED	JVM 线程调度与监控
FutureTask 任务状态	任务级别	7 种	NEW → COMPLETING → NORMAL/EXCEPTIONAL/CANCELLED/INTERRUPTED	异步任务生命周期

这 4 层状态相互独立又相互影响。例如：线程池进入 STOP 状态会中断 Worker，Worker 被中断会导致其持有的 Java 线程状态变化；FutureTask 的状态变化则独立于线程池和 Worker，仅反映任务自身的执行进展。理解这些状态的层次关系，有助于在排查线程池问题时准确定位问题所在层级。

下面首先介绍 ThreadPoolExecutor 自身的生命周期状态维护机制。

线程池运行的状态，并不是用户显式设置的，而是伴随着线程池的运行，由内部来维护。线程池内部使用一个变量维护两个值：运行状态(runState)和线程数量(workerCount)。这种将多个字段打包到一个整型变量中的设计称为字段打包(Field Packing)，是无锁编程中的一种惯用法。位运算只是实现手段，核心目的是将多个逻辑字段打包到一个物理字段中，实现单次CAS原子更新。

JDK中Field Packing应用案例：

类	字段	打包内容	设计目的
`ThreadPoolExecutor`	`ctl`	高3位runState + 低29位workerCount	原子更新状态与线程数
`ForkJoinPool`	`ctl`	高16位runState + 中间位workerCount + 其他标志	原子更新状态、线程数与并行度
`ReentrantReadWriteLock.Sync`	`state`	高16位读锁计数 + 低16位写锁计数	原子更新读写锁计数
`StampedLock`	`state`	高24位版本戳 + 第8位写锁标志 + 低7位读锁计数	乐观读锁与版本校验
`LongAdder.Cell`	状态字	竞争标志 + 计数值	高并发累加优化

在具体实现中，线程池将运行状态(runState)、线程数量(workerCount)两个关键参数的维护放在了一起，如下代码所示：

1	`private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));`

ctl这个AtomicInteger类型，是对线程池的运行状态和线程池中有效线程的数量进行控制的一个字段，它同时包含两部分的信息：线程池的运行状态(runState)和线程池内有效线程的数量(workerCount)，高3位保存runState，低29位保存workerCount，两个变量之间互不干扰。

原子更新机制：线程数放低位的设计使得ctl.getAndIncrement()可直接原子增加线程数而不影响高位状态，但必须校验workerCount < CAPACITY防止溢出污染状态位（不要忘记，CAPACITY 作为掩码是一个大整数）。状态变更则需要通过ctl.compareAndSet(oldCtl, ctlOf(newState, workerCountOf(oldCtl)))复合更新，一次CAS同时更新两个字段。

用一个变量去存储两个值，可避免在做相关决策时，出现不一致的情况，不必为了维护两者的一致，而占用锁资源。通过阅读线程池源代码也可以发现，经常出现要同时判断线程池运行状态和线程数量的情况。线程池也提供了若干方法去供用户获得线程池当前的运行状态、线程个数，均使用位运算实现：

public static void main(String[] args) {

        int COUNT_BITS = Integer.SIZE - 3;
        // 29
        System.out.println(COUNT_BITS);
        final int shifted = 1 << COUNT_BITS;
        // 1 与 29 个 0，所以左移意味着补 0，左移一位意味着补 1 个 0，左移 29 位意味着补 29 个 0，最后得到 30 位数：100000000000000000000000000000
        System.out.println(Integer.toBinaryString(shifted));
        int CAPACITY = shifted - 1;
        // 29个 1：11111111111111111111111111111，其实左边还有3个0
        System.out.println(Integer.toBinaryString(CAPACITY));
        // 高 3 位为 1，低 29 位为 0：11100000000000000000000000000000，和 CAPACITY 低 29 位为 1，高 3 位为 0 恰好相反
        System.out.println(Integer.toBinaryString(~CAPACITY));
        int RUNNING = -1 << COUNT_BITS;
        // -1 意味着 32 个 1：11111111111111111111111111111111
        System.out.println(Integer.toBinaryString(-1));
        // 3 个 1 和 29 个 0：11100000000000000000000000000000
        System.out.println(Integer.toBinaryString(RUNNING));
        
        // 重点：从后方补 0 的算法，可以把 state 的基准位从低位移到高位，这样大数的一部分就可以拿来表示有限状态了
        
        // 0 不管位移多少位都是 0
        int SHUTDOWN = 0 << COUNT_BITS;
        System.out.println(Integer.toBinaryString(SHUTDOWN));
        int STOP = 1 << COUNT_BITS;
        // 1 和 29 个 0：100000000000000000000000000000
        System.out.println(Integer.toBinaryString(STOP));
        int TIDYING = 2 << COUNT_BITS;
        // 10 和 29 个 0：1000000000000000000000000000000
        System.out.println(Integer.toBinaryString(TIDYING));
        int TERMINATED = 3 << COUNT_BITS;
        // 11 和 29 个 0：1100000000000000000000000000000
        System.out.println(Integer.toBinaryString(TERMINATED));

        // 总结：因为有5种状态，所以需要3个二进制位
    }

各状态的二进制表示（Java 7+ 支持 0b 前缀的二进制字面量）：

// 线程数容量：低29位全1
private static final int CAPACITY = (1 << COUNT_BITS) - 1;
// CAPACITY = 0b000_11111111111111111111111111111

// 运行状态：高3位存储
private static final int RUNNING    = -1 << COUNT_BITS;
// RUNNING    = 0b111_00000000000000000000000000000

private static final int SHUTDOWN   =  0 << COUNT_BITS;
// SHUTDOWN   = 0b000_00000000000000000000000000000

private static final int STOP       =  1 << COUNT_BITS;
// STOP       = 0b001_00000000000000000000000000000

private static final int TIDYING    =  2 << COUNT_BITS;
// TIDYING    = 0b010_00000000000000000000000000000

private static final int TERMINATED =  3 << COUNT_BITS;
// TERMINATED = 0b011_00000000000000000000000000000

位分布示意：

位索引:   31 30 29 | 28 27 26 ... 1 0
          └───┬───┘ └───────┬───────┘
           runState       workerCount
            (3位)           (29位)

RUNNING:      111 | 00000000000000000000000000000
SHUTDOWN:     000 | 00000000000000000000000000000
STOP:         001 | 00000000000000000000000000000
TIDYING:      010 | 00000000000000000000000000000
TERMINATED:   011 | 00000000000000000000000000000

状态值按数值大小排列：RUNNING(-1) < SHUTDOWN(0) < STOP(1) < TIDYING(2) < TERMINATED(3)，这使得 runStateAtLeast(c, state) 可通过数值比较判断状态是否达到或超过某阈值。

// ctl 的拆解与组合方法，基于位运算实现高效状态操作。
//
// 设计要点：
// 1. ~CAPACITY 即 0b11100000...00，取高 3 位的掩码
// 2. CAPACITY 即 0b00011111...11，取低 29 位的掩码
// 3. OR 运算组合状态与线程数，因为两者位不重叠
// 4. 这些操作都是纯位运算，无锁且高效
//
// 提取运行状态：取高 3 位，低 29 位置 0
private static int runStateOf(int c) {
    // c & ~CAPACITY = c & 0b11100000...00
    // 例如：0b111_xxxxx (RUNNING + workerCount) & 0b11100000...00 = 0b11100000...00 = RUNNING
    return c & ~CAPACITY;
}
// 提取线程数：取低 29 位，高 3 位置 0
private static int workerCountOf(int c) {
    // c & CAPACITY = c & 0b00011111...11
    // 例如：0b111_00000...00101 (RUNNING + 5) & 0b00011111...11 = 5
    return c & CAPACITY;
}
// 组合状态与线程数：高 3 位放 rs，低 29 位放 wc
private static int ctlOf(int rs, int wc) {
    // rs | wc，例如：RUNNING | 5 = 0b111_00000...00000 | 0b000_00000...00101 = 0b111_00000...00101
    return rs | wc;
}
// CAS 更新 ctl：原子性地更新状态+线程数
private boolean compareAndSetWorkerCount(int expect, int update) {
    return ctl.compareAndSet(expect, update);
}

运行状态	状态描述
RUNNING	能接受新提交的任务，并且也能处理阻塞队列中的任务。
SHUTDOWN	关闭状态，不再接受新提交的任务，但却可以继续处理阻塞队列中已保存的任务。
STOP	不能接受新任务，也不处理队列中的任务，会中断正在处理任务的线程。增加了两条措施，是一个更严厉的状态，理论上只要线程被中断完，线程池就可以走向关闭
TIDYING	所有的任务都已终止了，workerCount (有效线程数) 为0，这个状态的意思不是整理中，而是整理完了。
TERMINATED	在terminated() 方法执行完后进入该状态。

线程池生命周期.png

其中 running 既是初始态，也是中间态，所以才有private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));作为初始化块的一部分。

ThreadPoolExecutor 如何管理任务

设计哲学：任务与线程解耦

线程池的本质是对任务和线程的管理，而做到这一点最关键的思想就是将任务和线程两者解耦，不让两者直接关联，才可以做后续的分配工作。线程池采用生产者消费者模式，通过阻塞队列实现任务缓冲。

任务执行存在两种路径：

路径	触发条件	机制
firstTask 路径	创建新 Worker 时（核心线程未满，或队列满但非核心线程未满）	任务作为 `firstTask` 直接传入 Worker，省去入队再出队的开销
队列路径	任务入队后	空闲 Worker 通过 `getTask()` 从队列 `poll/take` 获取任务

// runWorker 源码片段——体现两种路径
Runnable task = w.firstTask;  // 路径1：Worker 创建时直接携带的任务
w.firstTask = null; // 置空以后才使用，只能使用一次
while (task != null || (task = getTask()) != null) {  // 路径2：从队列获取
    // 执行任务
}

任务提交入口：submit 与 execute

submit 方法（AbstractExecutorService 提供）：

// submit 方法是 AbstractExecutorService 提供的高级任务提交接口，与 execute 的核心区别是返回 Future。
// 设计模式：模板方法模式。submit 实现统一的任务包装和提交流程，底层调用子类实现的 execute()。
//
// 异常处理语义：
// - RejectedExecutionException：线程池已关闭或达到容量上限
// - NullPointerException：任务为 null

/**
 * @throws RejectedExecutionException {@inheritDoc}
 * @throws NullPointerException       {@inheritDoc}
 *
 * <p>Javadoc 释义：@throws 继承父接口 ExecutorService 的异常说明：
 * <ul>
 *   <li>RejectedExecutionException：任务被拒绝（线程池已关闭或饱和）</li>
 *   <li>NullPointerException：任务为 null</li>
 * </ul>
 */
public Future<?> submit(Runnable task) {
    if (task == null) throw new NullPointerException();
    RunnableFuture<Void> ftask = newTaskFor(task, null);
    execute(ftask);
    return ftask;
}

/**
 * @throws RejectedExecutionException {@inheritDoc}
 * @throws NullPointerException       {@inheritDoc}
 *
 * <p>Javadoc 释义：同上，此重载允许调用方预设返回值。
 * 任务执行完成后，{@code Future.get()} 将返回预设的 {@code result}，
 * 而非 {@code null}（{@code Runnable.run()} 本身无返回值）。
 */
public <T> Future<T> submit(Runnable task, T result) {
    if (task == null) throw new NullPointerException();
    RunnableFuture<T> ftask = newTaskFor(task, result);
    execute(ftask);
    return ftask;
}

/**
 * @throws RejectedExecutionException {@inheritDoc}
 * @throws NullPointerException       {@inheritDoc}
 *
 * <p>Javadoc 释义：最常用的重载，任务自带返回值逻辑。
 * {@code Callable.call()} 的返回值将作为 {@code Future.get()} 的结果。
 */
public <T> Future<T> submit(Callable<T> task) {
    if (task == null) throw new NullPointerException();
    RunnableFuture<T> ftask = newTaskFor(task);
    execute(ftask);
    return ftask;
}

execute 方法（ThreadPoolExecutor 核心）：

Worker执行任务.png

图中空任务的 worker 看下面对 execute 的入队分支的注释。

/**
 * execute 是 ThreadPoolExecutor 的核心方法，体现线程池任务调度策略的顶层设计。
 *
 * 【调度策略】先 core 后 queue 后非 core：
 * 先尝试创建核心线程，再入队，最后创建非核心线程。
 *
 * 【执行路径】任务有两种执行路径：
 * 1. 新线程直接执行：firstTask 作为新创建 Worker 的第一个任务
 * 2. 入队等待执行：空闲 Worker 通过 getTask() 从队列获取
 *
 * JDK 源码描述：Executes the given task sometime in the future.
 * The task may execute in a new thread or in an existing pooled thread.
 * - 「sometime in the future」：异步语义，不保证立即执行
 * - 「new thread or existing pooled thread」：上述两种执行路径
 *
 * 【拒绝时机】
 * - 线程池已 shutdown
 * - 队列已满且线程数达 maximumPoolSize
 *
 * @param command 待执行的任务，不允许为 null
 * @throws RejectedExecutionException 任务被拒绝时抛出，由 RejectedExecutionHandler 决定
 * @throws NullPointerException command 为 null 时抛出
 */
public void execute(Runnable command) {
    if (command == null)
        throw new NullPointerException();

    /*
     * ========== 三步调度策略 ==========
     *
     * 步骤1：workerCount < corePoolSize → 创建核心线程直接执行
     * 步骤2：入队成功 → 双重检查（状态检查 + 消费者检查）
     * 步骤3：入队失败/线程池不再运行 → 创建非核心线程，失败则拒绝
     *
     * 关键设计差异：
     * - addWorker 成功 → 任务已绑定线程，无需后续检查
     * - offer 成功 → 任务在队列中无"主人"，必须双重检查
     *
     * 注：此处"双重检查"指入队前后的状态校验，非 DCL 模式。
     */
    int c = ctl.get();

    // ==================== 步骤1：尝试创建核心线程 ====================
    if (workerCountOf(c) < corePoolSize) {
        if (addWorker(command, true))  // true = 受 corePoolSize 限制。在这个方法里，只有这一个地方可能 addWorker 的类型是 true
            return;  // 成功：任务已绑定到 Worker 线程，无需后续检查
        /*
         * 【失败原因】workerCount < corePoolSize 仍可能失败：
         * (1) 池状态变为 SHUTDOWN/STOP：并发关闭，状态校验失败
         * (2) workerCount 已达 corePoolSize：竞态条件下其他线程抢先创建
         * (3) ThreadFactory 返回 null：工厂拒绝创建线程
         * (4) OOM 或 CAS 失败：资源或竞争问题
         *
         * 【Fallback 语义】失败后进入步骤2是合理的——若池仍 RUNNING，
         * 任务可尝试入队，保障任务不丢失。就好像线程池的 wc >= corePoolSize 一样。
         */
        c = ctl.get();  // 状态可能已变化，刷新 ctl 用于步骤2/3的判断
    }

    // ==================== 步骤2：尝试入队 ====================
    if (isRunning(c) && workQueue.offer(command)) {
        /*
         * 【为何必须双重检查】
         * offer 成功时任务仅在队列中，无"主人"。从 offer 到状态检查之间存在 TOCTOU 窗口：
         * - 池可能在此窗口内关闭
         * - 所有工作线程可能在此窗口内退出（allowCoreThreadTimeOut=true 或异常退出）
         *
         * 从这里我们可以看得出来，我们在外部尝试操作线程和队列的时候，要面对线程池状态/线程数/队列状态的瞬息万变的变化。
         * 
         * 因此需要双重检查：
         * (1) 确认池仍在运行，否则移除任务并拒绝
         * (2) 确认有消费者线程，否则补偿创建
         */
        int recheck = ctl.get();

        // 检查1：池是否在入队窗口内关闭？如果关闭，则尝试移除 command，这一步仍然可能失败
        if (!isRunning(recheck) && remove(command))
            reject(command);  // 移除成功则拒绝；移除失败说明已被取走，无需处理

        // 检查2：池仍在运行/移除命令失败，但工作线程是否全部销毁？
        else if (workerCountOf(recheck) == 0)
            /*
             * 【何以此境？】池 RUNNING 但 wc=0 的场景：
             * - allowCoreThreadTimeOut=true：核心线程空闲超时退出
             * - 任务执行异常：runWorker() 抛未捕获异常，触发 processWorkerExit
             *   移除 Worker 并尝试补偿（addWorker(null, false)），但补偿可能失败
             *   （池状态变为 STOP / 线程数已达 maximumPoolSize / ThreadFactory 返回 null 等）
             *
             * 【罕见场景】池已关闭 + remove 失败 + wc=0：
             * command 被其他 Worker 取走后该 Worker 立即退出，导致 wc=0。
             * 此时任 addWorker(null, false) 在 SHUTDOWN 状态下可能成功
             * （firstTask==null 且队列非空），确保剩余任务有消费者。
             *
             * 【任务与线程解耦】新 Worker 获取的是队首任务，
             * 不一定是本次 command——体现解耦设计。
             *
             * addWorker(null, false)：
             * - null = 新线程从队列取任务，不直接执行 command。这个 null 参数在线程池里只有内部方法才用，产生的 worker 是所谓的 drain worker
             * - false = 受 maximumPoolSize 限制
             */
            addWorker(null, false);
        // 主流路径：双重检查通过，任务正常入队且有消费者
        // 注：大多数情况下 workerCountOf(recheck) 不为 0，两个 if 都不执行
    }

    // ==================== 步骤3：尝试创建非核心线程 ====================
    // 【进入条件】步骤2的 if 条件为 false，有两种情况：
    // (1) isRunning(c) = false：池已关闭，短路不尝试 offer
    // (2) workQueue.offer(command) = false：入队失败
    else if (!addWorker(command, false)) {  // false = 受 maximumPoolSize 限制
        /*
         * 【入队失败场景】offer 返回 false：
         * (1) 有界队列已满：ArrayBlockingQueue、LinkedBlockingQueue 容量耗尽
         * (2) SynchronousQueue：无容量，offer 永远返回 false
         * (3) 自定义队列拒绝：策略性拒绝
         *
         * 【拒绝条件】addWorker 失败意味着：
         * - 池已关闭（SHUTDOWN/STOP），或
         * - 线程数已达 maximumPoolSize（饱和）
         *
         * 【SHUTDOWN vs STOP】
         * - SHUTDOWN：不接受新任务，但处理队列中任务。addWorker(firstTask,null) 可成功
         * - STOP：不接受新任务，不处理队列，中断执行中任务。addWorker 必失败
         * 此处 addWorker(command, false) 的 firstTask 非null，
         * 故即使在 SHUTDOWN 状态下也会失败——SHUTDOWN 只允许创建"取队列任务"的线程。
         *
         * 【为何无需双重检查】addWorker 失败无遗留状态——任务未入队、未绑定线程，
         * 直接拒绝即可，无状态需要回滚或清理。
         */
        reject(command);
    }
}

任务调度流程.png

创建工作线程：addWorker

addWorker 是 execute 三步调度策略的核心支撑方法，负责创建并启动工作线程。

申请线程执行流程图.png

Worker 可以被认为是线程和锁的结合体，它的使命就是不断地把 runnable/command/task 从缓冲队列里拿出来，放在自己的 thread 里执行：

// addWorker 是 ThreadPoolExecutor 创建并启动工作线程的核心方法。
// 方法逻辑分两阶段：
// 1. 双层自旋增加 workerCount：外层检查 runState，内层 CAS 增加 workerCount
// 2. 加锁创建并启动 Worker：持有 mainLock 期间创建 Worker、加入 workers 集合、启动线程
//
// 返回 false 的场景：
// - 线程池已 STOP 或更高状态
// - 线程池已 SHUTDOWN 且（firstTask 不为 null 或队列为空）
// - workerCount 达到上限（core ? corePoolSize : maximumPoolSize）
// - ThreadFactory 创建线程失败（返回 null 或抛异常，如 Thread.start() 的 OutOfMemoryError）
//
// 参数说明：
// - firstTask：新线程首个执行的任务。为 null 时创建空闲 Worker 从队列获取任务（prestartCoreThread 或替换死亡 Worker）；
//   不为 null 时绕过队列直接执行（线程数 < corePoolSize 或队列满时），节省开销
// - core：true 使用 corePoolSize 为上限，false 使用 maximumPoolSize。采用布尔值而非数值确保每次读取最新配置，
//   允许线程池运行时 reconfigure
//
// 线程创建失败时：回滚 workerCount 并尝试终止线程池
private boolean addWorker(Runnable firstTask, boolean core) {
    // retry 是外部自旋的标签。大自旋保证 rs 是稳定的，小自旋保证 wc 是稳定的，在双自旋里面保证 wc 的修改成功
    // 这一步的 break 意味着自旋成功了而不是失败了
    retry:
    for (;;) {
        int c = ctl.get();
        // 获取运行时状态
        int rs = runStateOf(c);
        
        // 【为什么要在增加 worker 前检查线程池状态？】
        // 线程池有生命周期状态机，SHUTDOWN 表示「不再接受新任务但执行队列剩余任务」，
        // STOP 表示「立即终止，不执行队列任务」。此检查是线程池语义的最后一道防线——
        // 调用方（如 execute）可能已通过状态检查，但在并发场景下，其他线程可能在
        // execute 检查后、addWorker 执行前调用 shutdown()，因此 addWorker 必须再次校验。
        //
        // 【唯一例外场景】rs == SHUTDOWN && firstTask == null && workQueue 非空
        // 此时机：SHUTDOWN 后队列中还有任务，需要创建线程（firstTask=null）来消费队列。
        // 这种 worker 称为「drain worker」，仅用于清理队列，不接受外部提交的新任务。
        // 若 firstTask 不为 null，说明是外部提交的新任务，违反 SHUTDOWN 语义，必须拒绝。
        // 若队列为空，则没有任务需要消费，创建 worker 毫无意义。
        if (rs >= SHUTDOWN &&
            ! (rs == SHUTDOWN &&
               firstTask == null &&
               ! workQueue.isEmpty()))
            return false;
        
        // 内层自旋：处理 workerCount 的 CAS 竞争
        for (;;) {
            int wc = workerCountOf(c);
            
            // 【为什么要检查线程数量上限？】
            // 线程是昂贵资源（每个线程约 1MB 栈空间），无限制创建会导致 OOM 或系统资源耗尽。
            // core 参数决定上限来源：true 用 corePoolSize（常驻线程数），false 用 maximumPoolSize（峰值线程数）。
            //
            // 【为什么用布尔值 core 而非直接传入数值？】
            // corePoolSize 和 maximumPoolSize 可在运行时通过 setCorePoolSize/setMaximumPoolSize 修改。
            // 布尔值确保每次都读取最新配置，而非调用方缓存的旧值。若传入数值，
            // 调用方可能在读取配置后、调用 addWorker 前配置已被其他线程修改，导致上限检查失效。
            if (wc >= CAPACITY ||
                wc >= (core ? corePoolSize : maximumPoolSize))
                return false;
            
            // 【为什么要用 CAS 而非直接递增？】
            // ctl 是共享状态，多个线程可能同时调用 addWorker，直接递增会丢失更新。
            // CAS 是无锁并发的标准模式：读取当前值 → 尝试原子更新 → 失败则重试。
            // 相比加锁，CAS 在低竞争时性能更好，但需要处理失败重试逻辑。
            if (compareAndIncrementWorkerCount(c))
                break retry;
            
            // 【为什么 CAS 失败后要重新检查状态？】
            // CAS 失败说明 ctl 被其他线程修改了，有两种可能：
            // 1. workerCount 被改：其他线程也在创建 worker，CAS 竞争失败
            // 2. runState 被改：其他线程调用了 shutdown() 或 shutdownNow()
            // 第二种情况必须返回外层循环重新判断是否还能创建 worker，
            // 否则可能在线程池已关闭的状态下继续创建线程，违反状态机语义。
            c = ctl.get();  // Re-read ctl
            if (runStateOf(c) != rs)
                continue retry;
            // 若仅 workerCount 变化，状态机语义未变，在内层循环重试 CAS 即可
        }
    }
    
    // 至此，workerCount 已成功递增（CAS 成功），但 Worker 对象尚未创建。
    // 这种「先占位后创建」的设计需要回滚机制：若后续创建失败，必须归还占位。
    
    boolean workerStarted = false;
    boolean workerAdded = false;
    Worker w = null;
    try {
        // firstTask 已在状态检查中验证：SHUTDOWN 状态下只有 firstTask==null 且队列非空才允许创建 Worker。
        // Worker 构造函数接受 null（drain worker 的 firstTask 为 null）。
        w = new Worker(firstTask);
        final Thread t = w.thread;
        
        // 【为什么 ThreadFactory 返回的 thread 可能为 null？】
        // ThreadFactory 是扩展点，用户可实现自定义工厂。恶意或错误的实现可能返回 null。
        // 这是防御性编程：不信任用户代码的返回值，避免后续 NPE。
        // 若 t 为 null，workerStarted 保持 false，最终触发 addWorkerFailed 回滚。
        if (t != null) {
            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                // 【为什么加锁后还要重新检查状态？TOCTOU 问题】
                // Time-of-Check to Time-of-Use：检查时刻与使用时刻之间，状态可能被修改。
                // 在 CAS 成功后、获取 mainLock 前，其他线程可能调用 shutdown() 或 shutdownNow()。
                // 若不加锁重检，可能在 SHUTDOWN 后仍然添加 Worker 并启动线程，违反状态机语义。
                // mainLock 保护 workers 集合和 largestPoolSize 等簿记数据的修改，
                // 同时也作为状态重检的同步点。
                int rs = runStateOf(ctl.get());

                // 【加锁后状态重检的分支】
                // rs < SHUTDOWN：正常运行状态，允许添加
                // rs == SHUTDOWN && firstTask == null：SHUTDOWN 状态下仅允许 drain worker
                // 其他情况：状态已变为 STOP 或 SHUTDOWN 且 firstTask 不为 null，拒绝添加
                if (rs < SHUTDOWN ||
                    (rs == SHUTDOWN && firstTask == null)) {
                    
                    // 【为什么要检查 t.isAlive()？】
                    // Thread 对象只能 start 一次，重复调用 start() 会抛 IllegalThreadStateException。
                    // 自定义 ThreadFactory 可能返回已启动的线程（如从线程池中复用），
                    // 若不检查直接加入 workers 集合，后续 t.start() 会失败。
                    // 此处主动检查并抛异常，比让系统在 start() 时抛更早暴露问题。
                    if (t.isAlive())
                        throw new IllegalThreadStateException();
                    workers.add(w);
                    int s = workers.size();
                    
                    // 【为什么要更新 largestPoolSize？】
                    // 纯粹是统计信息，用于监控和调试（如 JMX 暴露）。
                    // 不影响线程池运行逻辑，但帮助运维人员了解线程池的历史峰值使用情况。
                    if (s > largestPoolSize)
                        largestPoolSize = s;
                    workerAdded = true;
                }
                // 若状态已变为拒绝添加，workerAdded 保持 false，
                // 但 workerCount 已在 CAS 阶段递增，必须回滚。
            } finally {
                mainLock.unlock();
            }
            if (workerAdded) {
                // 这一步就启动了 run 钩子，走进线程池的 runWorker 的主循环
                t.start();
                workerStarted = true;
            }
        }
    } finally {
        // 【为什么要回滚？】
        // 若 workerStarted 为 false，说明 Worker 创建或启动失败，但 CAS 阶段已递增 workerCount。
        // 若不回滚，workerCount 会比实际运行的线程数多，导致线程池永远无法达到预期的线程数量，
        // 甚至无法正确判断是否需要创建新线程（因为「已有线程数」被错误地虚高）。
        // tryTerminate() 是因为减少了一个可能阻止终止的 worker，需检查是否满足终止条件。
        if (! workerStarted)
            addWorkerFailed(w);
    }
    return workerStarted;
}

/**
 * Rolls back the worker thread creation.
 * - removes worker from workers, if present
 * - decrements worker count
 * - rechecks for termination, in case the existence of this
 *   worker was holding up termination
 */
/**
 * Rolls back the worker thread creation.
 * - removes worker from workers, if present
 * - decrements worker count
 * - rechecks for termination, in case the existence of this
 *   worker was holding up termination
 *
 * <p>addWorkerFailed 是 addWorker 的回滚逻辑，当 Worker 创建或启动失败时调用。
 * Javadoc 释义：
 * <ul>
 *   <li>「Rolls back」：回滚操作，补偿 addWorker 中已完成的部分工作</li>
 *   <li>「removes worker from workers」：从 workers 集合移除（需加 mainLock）</li>
 *   <li>「decrements worker count」：递减 workerCount，回滚之前的 CAS 增加</li>
 *   <li>「rechecks for termination」：检查是否触发终止条件，此 Worker 可能是阻止线程池终止的最后一个</li>
 * </ul>
 */
private void addWorkerFailed(Worker w) {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        if (w != null)
            workers.remove(w);
        // 不管 w 是否为 null，都修改 wc，因为进入之前，不管是否产生了 worker，wc 都增加过了
        decrementWorkerCount();
        // 【为什么线程创建失败要调用 tryTerminate？】
        // tryTerminate() 是条件检查而非强制关闭：内部检查 runState >= SHUTDOWN 且 workerCount == 0 才执行终止。
        // 此处调用的原因：decrementWorkerCount() 后 workerCount 可能变为 0，若线程池正处于关闭状态，
        // 则满足终止条件，需触发 TIDYING → TERMINATED 转换。若条件不满足，tryTerminate() 直接返回，无副作用。
        // 不调用则风险：线程池可能永远卡在 SHUTDOWN 状态（workerCount=0 但未触发终止流程）。
        tryTerminate();
    } finally {
        mainLock.unlock();
    }
}

/**
 * Decrements the workerCount field of ctl. This is called only on
 * abrupt termination of a thread (see processWorkerExit). Other
 * decrements are performed within getTask.
 *
 * 设计特点：无限自旋（do-while 空循环体），必须保证递减成功，不允许失败。
 *
 * 实际调用场景（Javadoc 描述不完整）：
 * 1. addWorkerFailed：Worker 创建/启动失败时回滚
 * 2. getTask()：线程池 SHUTDOWN 且队列空，或 STOP 及以上状态时
 * 3. processWorkerExit：仅当 completedAbruptly=true（任务抛出未捕获异常）时
 */
private void decrementWorkerCount() {
    // 减 worker count 的操作必须自旋到成功，这种小成员的自旋修改不需要 sleep！
    do {} while (! compareAndDecrementWorkerCount(ctl.get()));
}

private boolean compareAndIncrementWorkerCount(int expect) {
    // 因为 wc 在 32 位整数的低位，所以直接对 expect + 1 即可。
    return ctl.compareAndSet(expect, expect + 1);
}

任务缓冲：阻塞队列

阻塞队列(BlockingQueue)是一个支持两个附加操作的队列。这两个附加的操作是 （阻塞的本质即为此）：在队列为空时，获取元素的线程会等待队列变为非空。当队列满时，存储元素的线程会等待队列可用。 阻塞队列常用于生产者和消费者的场景，生产者是往队列里添加元素的线程，消费者是从队列里拿元素的线程。阻塞队列就是生产者存放元素的容器，而消费者也只从容器里拿元素。

阻塞队列的工作原理.png

名称	描述
ArrayBlockingQueue	一个用数组实现的有界阻塞队列，此队列按照先进先出(FIFO)的原则对元素进行排序。支持公平锁和非公平锁。
DelayQueue	一个基于 `PriorityQueue`（非阻塞）实现延迟获取的无界队列，元素必须实现 `Delayed` 接口。在创建元素时可指定延迟时间，只有延时期满后才能从队列中获取元素。
LinkedBlockingDeque	一个由链表结构组成的双向阻塞队列。队列头部和尾部都可以添加和移除元素，多线程并发时，可以将锁的竞争最多降到一半。
LinkedBlockingQueue	一个由链表结构组成的有界队列，此队列按照先进先出(FIFO)的原则对元素进行排序。此队列的默认长度为Integer.MAX_VALUE，所以默认创建的该队列有容量危险。
LinkedTransferQueue	一个由链表结构组成的无界阻塞队列，相当于其它队列，LinkedTransferQueue队列多了transfer和tryTransfer方法。
PriorityBlockingQueue	一个支持线程优先级排序的无界队列，默认自然序进行排序，也可以自定义实现compareTo()方法来指定元素排序规则，不能保证同优先级元素的顺序。
`SynchronousQueue`	一个不存储元素的阻塞队列，每一个put操作必须等待take操作，否则不能添加元素。支持公平锁和非公平锁。SynchronousQueue的一个使用场景是在线程池里。Executors.newCachedThreadPool()就使用了SynchronousQueue，这个线程池根据需要（新任务到来时）创建新的线程，如果有空闲线程则会重复使用，线程空闲了60秒后会被回收。
`DelayedWorkQueue`	`ScheduledThreadPoolExecutor` 的内部类，基于二叉堆实现。是延时线程池的刚需组件：只有通过 DelayedWorkQueue 的 `take()` 阻塞到任务到期，才能在复用 ThreadPoolExecutor Worker 机制的同时实现延时调度。不在公开 API 之列。

阻塞队列的详细选型指南（锁实现差异、使用示例、性能对比）见下文阻塞队列选型指南章节。

阻塞队列选型指南

锁实现差异分析：

各阻塞队列在锁策略上有本质差异，这直接影响并发性能和适用场景。

队列	锁策略	锁数量	设计原因
`ArrayBlockingQueue`	单锁	1 把 ReentrantLock	数组实现，put/take 需同时维护 count、head、tail，单锁保证原子性
`LinkedBlockingQueue`	双锁（读写分离）	2 把 ReentrantLock	链表实现，写操作修改 tail，读操作修改 head，互不干扰
`LinkedBlockingDeque`	单锁	1 把 ReentrantLock	双端操作可能同时涉及头尾，无法分离
`PriorityBlockingQueue`	单锁	1 把 ReentrantLock	堆调整涉及整个数组，读写无法分离
`DelayQueue`	单锁	1 把 ReentrantLock	基于 PriorityBlockingQueue，堆操作无法分离
`SynchronousQueue`	无锁 CAS	无显式锁	不存储元素，直接传递，CAS 实现匹配
`LinkedTransferQueue`	无锁 CAS	无显式锁	链表 + 松弛操作，CAS 实现无锁算法

为什么 LinkedBlockingQueue 能用双锁？

// LinkedBlockingQueue 的核心结构
public class LinkedBlockingQueue<E> {
    private final ReentrantLock takeLock = new ReentrantLock();  // 读锁
    private final ReentrantLock putLock = new ReentrantLock();   // 写锁
    private final Condition notEmpty = takeLock.newCondition();  // 读条件
    private final Condition notFull = putLock.newCondition();    // 写条件
    
    // 写操作只操作 tail 节点
    public void put(E e) {
        putLock.lockInterruptibly();  // 只获取写锁
        try {
            // 插入到链表尾部，修改 tail 引用
            // 与读操作互不干扰
        } finally {
            putLock.unlock();
        }
    }
    
    // 读操作只操作 head 节点
    public E take() {
        takeLock.lockInterruptibly();  // 只获取读锁
        try {
            // 从链表头部取出，修改 head 引用
            // 与写操作互不干扰
        } finally {
            takeLock.unlock();
        }
    }
}

链表的物理结构决定了读写操作修改的是不同的内存位置：

写操作：修改 tail.next 和 tail 引用
读操作：修改 head 和 head.next 引用

两者互不干扰，因此可以分离锁。这是数据结构特性决定的。

为什么 ArrayBlockingQueue 不能用双锁？

// ArrayBlockingQueue 的核心结构
public class ArrayBlockingQueue<E> {
    final Object[] items;  // 环形数组
    int takeIndex;         // 读指针
    int putIndex;          // 写指针
    int count;             // 元素计数（共享变量！）
    final ReentrantLock lock;  // 单锁
    
    public void put(E e) {
        lock.lock();  // 必须获取同一把锁
        try {
            items[putIndex] = e;
            putIndex = inc(putIndex);  // 可能与 takeIndex 重叠
            count++;                   // 修改共享计数
        } finally {
            lock.unlock();
        }
    }
    
    public E take() {
        lock.lock();  // 必须获取同一把锁
        try {
            E x = items[takeIndex];
            items[takeIndex] = null;
            takeIndex = inc(takeIndex);  // 可能与 putIndex 重叠
            count--;                     // 修改共享计数
            return x;
        } finally {
            lock.unlock();
        }
    }
}

数组的环形结构导致读写操作存在共享状态：

count 计数器：put 需要检查是否满（count == capacity），take 需要检查是否空（count == 0）
指针回绕：putIndex 和 takeIndex 都会在数组末尾回绕到 0，可能相遇
容量判断：判断满/空需要同时看到 count、takeIndex、putIndex 的一致状态

如果用双锁，put 和 take 同时修改 count，会出现竞态条件。即使使用 AtomicInteger，也无法保证 count 与指针的一致性。

SynchronousQueue 为什么不需要锁？

// SynchronousQueue 的核心机制
// 公平模式：TransferQueue（基于链表的队列）
// 非公平模式：TransferStack（基于栈的 LIFO 结构）

// 核心操作：匹配生产者和消费者
public E take() {
    // 尝试匹配一个等待的生产者
    // 如果找到，直接交换数据，无需加锁
    // 如果没找到，当前线程等待被匹配
}

public void put(E e) {
    // 尝试匹配一个等待的消费者
    // 如果找到，直接交换数据，无需加锁
    // 如果没找到，当前线程等待被匹配
}

SynchronousQueue 不存储任何元素，它的核心是"直接传递"：

生产者线程将元素直接交给消费者线程
如果没有消费者，生产者等待
如果没有生产者，消费者等待
整个过程通过 CAS 操作完成线程间匹配，无需维护数据结构

选型建议：

场景	推荐队列	理由
通用生产消费（首选）	ArrayBlockingQueue	预分配数组，缓存友好，无 GC 压力，实测性能稳定
高并发 + 队列长期非空	LinkedBlockingQueue（指定容量）	双锁优势显现，但须指定容量
任务直接执行，无缓冲	SynchronousQueue	无锁 CAS，直接传递
需要优先级	PriorityBlockingQueue	堆排序，无锁替代方案少
延迟调度	DelayQueue	时间排序，无可替代

flowchart TD
    A[选择阻塞队列] --> B{是否需要存储元素?}
    B -->|否| C[SynchronousQueue]
    B -->|是| D{是否需要延迟/优先级?}
    
    D -->|延迟| E[DelayQueue]
    D -->|优先级| F[PriorityBlockingQueue]
    D -->|否| G[ArrayBlockingQueue<br/>首选-缓存友好]
    
    G --> H{需要双锁?}
    H -->|否| I[使用 ArrayBlockingQueue]
    H -->|是| J{LinkedBlockingQueue}
    
    J --> K[指定容量-推荐]
    J --> L[默认容量-OOM风险]
    
    style C fill:#F0E68C
    style E fill:#DDA0DD
    style F fill:#FFB6C1
    style G fill:#90EE90
    style I fill:#90EE90
    style K fill:#87CEEB
    style L fill:#FF6347

ThreadPoolExecutor 任务拒绝

当线程池的任务缓存队列已满并且线程池中的线程数目达到 maximumPoolSize 时，如果还有任务到来就会采取任务拒绝策略。

拒绝策略的两种触发场景：

触发场景	描述	常见原因
线程池饱和	队列已满 + 线程数达到 maximumPoolSize	任务提交速率持续高于处理速率
线程池关闭	调用 `shutdown()` 或 `shutdownNow()` 后仍尝试提交任务	业务逻辑未正确检查线程池状态

常见误区：许多开发者认为拒绝策略只在"线程池满了"时触发，但实际上线程池关闭后尝试提交任务同样会触发拒绝策略。如果业务逻辑未正确检查线程池状态（通过 isShutdown() 或 isTerminated()），可能导致意外的任务丢失。

强制触发线程中断与拒绝的完整场景汇总：

根据Java线程池的实现，以下场景会强制触发线程中断或拒绝新任务：

主动触发（用户代码显式调用）：

shutdownNow()：强制中断所有工作线程
Future.cancel(true)：强制中断指定任务的执行线程

系统被动触发（内部机制自动触发）：

线程池饱和：队列满+达最大线程数 -> 触发 RejectedExecutionHandler
awaitTermination超时：shutdown后等待超时 -> 强制关闭
ScheduledFutureTask异常：周期任务未捕获异常 -> 终止调度
tryTerminate自旋中断：线程池终止过程中 -> 中断空闲Worker

拒绝策略的四种内置实现：

AbortPolicy：抛出 RejectedExecutionException
CallerRunsPolicy：由调用者线程执行
DiscardPolicy：静默丢弃
DiscardOldestPolicy：丢弃最老任务

最佳实践：

不要依赖强制中断来停止任务，任务应支持检查中断标志
优先使用cancel(false)让任务自然完成
合理选择拒绝策略，根据业务对任务丢失的容忍度决定

// 示例：线程池关闭后仍被拒绝的任务
ExecutorService executor = new ThreadPoolExecutor(
    1, 1, 0L, TimeUnit.MILLISECONDS,
    new ArrayBlockingQueue<>(1),
    new ThreadPoolExecutor.AbortPolicy()
);
executor.shutdown();  // 关闭线程池

// 此任务会被拒绝策略拒绝（即使队列未满）
executor.execute(() -> System.out.println("task"));

拒绝策略触发流程：

sequenceDiagram
    participant Client as 客户端
    participant TPE as ThreadPoolExecutor
    participant Queue as 阻塞队列
    participant Handler as RejectedExecutionHandler
    
    Client->>TPE: execute(task)
    TPE->>TPE: 检查线程数 < corePoolSize?
    
    alt 线程数 < corePoolSize
        TPE->>TPE: 创建核心线程执行
    else 线程数 >= corePoolSize
        TPE->>Queue: offer(task)
        alt 队列未满
            Queue-->>TPE: true
            TPE-->>Client: 任务入队成功
        else 队列已满
            Queue-->>TPE: false
            TPE->>TPE: 检查线程数 < maximumPoolSize?
            alt 线程数 < maximumPoolSize
                TPE->>TPE: 创建非核心线程执行
            else 线程数 >= maximumPoolSize
                TPE->>Handler: rejectedExecution(task, executor)
                Note over Handler: 执行拒绝策略
            end
        end
    end

拒绝策略对比图：

graph TB
    subgraph 拒绝策略对比
        A[AbortPolicy] --> A1[抛出异常]
        A1 --> A2[调用方感知]
        A2 --> A3[适合：需要明确处理拒绝的场景]
        
        B[CallerRunsPolicy] --> B1[调用者执行]
        B1 --> B2[提供反压]
        B2 --> B3[适合：不能丢弃任务的场景]
        
        C[DiscardPolicy] --> C1[静默丢弃]
        C1 --> C2[无感知]
        C2 --> C3[适合：允许丢弃且无需感知]
        
        D[DiscardOldestPolicy] --> D1[丢弃最老任务]
        D1 --> D2[新任务优先]
        D2 --> D3[适合：新任务更重要的场景]
    end
    
    style A fill:#FF6B6B
    style B fill:#4ECDC4
    style C fill:#95A5A6
    style D fill:#F39C12

ThreadPoolExecutor 如何管理线程

术语定义：线程回收 vs 资源回收

线程池文档中涉及两种"回收"概念，需明确区分：

术语	主体	行为	触发者
线程回收	线程池	从 workers 集合移除线程引用，让线程退出运行循环	interruptIdleWorkers / getTask 超时
资源回收	JVM/GC	回收 Thread 对象及关联对象的内存	垃圾收集器

线程回收的本质：线程池层面的资源管理行为。线程池通过 interruptIdleWorkers() 发起回收请求，或 getTask() 超时返回 null 触发线程退出，最终由 processWorkerExit() 执行清理（移除 workers 引用、更新计数）。线程对象本身的内存回收是 JVM 的职责，不属于线程池"回收"范畴。

Javadoc 术语印证：ForkJoinPool 的 common pool 文档明确使用 “reclaim”：

“its threads are slowly reclaimed during periods of non-use, and reinstated upon subsequent use”

getTask() 返回 null 会让线程退出，走入 processWorkerExit。

ThreadPoolExecutor没有"核心线程"这种线程类型或线程属性。所有 Worker 结构相同，不存在标记某个线程为"核心"的字段。所谓的"核心线程"只是 workerCount 中属于 corePoolSize 范围内的计数——这是一个动态边界，同一个线程在不同时刻可能处于边界内或边界外。线程是否因 idle 退出是 getTask() 每次循环的动态决策：当 workerCount > corePoolSize 时使用 poll(keepAliveTime)，超时返回 null 导致线程退出。可以认为这部分线程天然带超时，超时机制对其无条件生效，只受 keepAliveTime 控制。只要 getTask 得到 null，就不会回到 while 循环，而进入 processWorkerExit。当 workerCount <= corePoolSize 时使用 take() 无限阻塞，线程不会因 idle 退出。若 allowCoreThreadTimeOut=true，则所有线程均会因 idle 超时退出。

mainLock：线程池的全局互斥锁

ThreadPoolExecutor 使用 mainLock（ReentrantLock）保护线程池的核心数据结构和同步点。

mainLock 保护的对象：

保护对象	类型	原因
`workers`	`HashSet<Worker>`	HashSet 非线程安全，增删遍历需互斥
`largestPoolSize`	`int`	记录历史最大线程数，多线程更新需同步
`completedTaskCount`	`long`	任务完成总数累加，需原子性保证
`termination`	`Condition`	状态转换时的唤醒信号，需与锁配合

graph TB
    mainLock[mainLock<br/>ReentrantLock]

    subgraph 保护对象
        workers[workers<br/>HashSet Worker]
        largestPoolSize[largestPoolSize<br/>int]
        completedTaskCount[completedTaskCount<br/>long]
        termination[termination<br/>Condition]
    end

    subgraph 使用场景
        addWorker[addWorker<br/>创建线程]
        addWorkerFailed[addWorkerFailed<br/>创建失败]
        processWorkerExit[processWorkerExit<br/>线程退出]
        interruptIdleWorkers[interruptIdleWorkers<br/>中断空闲线程]
        tryTerminate[tryTerminate<br/>状态转换]
        getActiveCount[getActiveCount 等<br/>监控统计]
    end

    mainLock --> workers
    mainLock --> largestPoolSize
    mainLock --> completedTaskCount
    mainLock --> termination

    addWorker --> mainLock
    addWorkerFailed --> mainLock
    processWorkerExit --> mainLock
    interruptIdleWorkers --> mainLock
    tryTerminate --> mainLock
    getActiveCount --> mainLock

mainLock 的使用场景：

场景	方法	操作内容
创建线程	`addWorker()`	Worker 加入 workers、更新 largestPoolSize、状态重检
创建失败	`addWorkerFailed()`	从 workers 移除、回滚 workerCount
线程退出	`processWorkerExit()`	累加 completedTaskCount、从 workers 移除
中断空闲线程	`interruptIdleWorkers()`	遍历 workers、tryLock 检测空闲
状态转换	`tryTerminate()`	TIDYING→TERMINATED、termination.signalAll()
监控统计	`getActiveCount()` 等	遍历 workers 统计活跃线程数

TOCTOU 问题与状态重检：

addWorker() 中，CAS 增加 workerCount 后、获取 mainLock 前，其他线程可能调用 shutdown() 或 shutdownNow() 改变状态。mainLock 作为同步点，允许加锁后重新检查状态，避免在 SHUTDOWN 后错误添加 Worker。

// addWorker 中的典型模式
if (compareAndIncrementWorkerCount(c)) {  // CAS 成功
    // ... 创建 Worker ...
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();  // 获取全局锁
    try {
        int rs = runStateOf(ctl.get());  // 重检状态（TOCTOU）
        if (rs < SHUTDOWN || (rs == SHUTDOWN && firstTask == null)) {
            workers.add(w);              // 保护 workers 修改
            largestPoolSize = Math.max(largestPoolSize, workers.size());
        }
    } finally {
        mainLock.unlock();
    }
}

为何不用读写锁：

workers 的修改操作（增删 Worker）主要发生在线程创建、退出、关闭阶段
遍历操作主要发生在监控方法（getActiveCount、getPoolSize 等）和关闭阶段
正常运行期间，这些操作竞争不频繁，读写锁的额外开销（维护读写状态、支持锁降级）不值得

mainLock 与 ctl 的分工：

ctl（AtomicInteger）：高 3 位运行状态 + 低 29 位线程数，使用 CAS 无锁更新，自身保证原子性
mainLock：保护以下三类对象：
- 非线程安全数据结构：workers（HashSet）
- volatile 变量的复合操作：largestPoolSize、completedTaskCount —— volatile 仅保证可见性，不保证复合操作（如 max = Math.max(max, size)）的原子性。实际上这种对 volatile 的复合操作需要使用同步块的设计大量遍布于 java 的日常实践中，是一种基础原则。
- 同步原语：termination（Condition）—— 需与锁配合使用

两者协调：CAS 先更新 ctl，成功后再获取 mainLock 修改受保护对象。若 mainLock 获取后状态检查失败，则回滚 ctl（decrementWorkerCount()）。

线程数保量机制

corePoolSize 的三重语义

corePoolSize 在线程池中扮演三个角色：

创建阈值：execute() 方法中，当 workerCount < corePoolSize 时，优先创建新线程直接执行任务，绕过入队。
超时策略分界：getTask() 方法中，workerCount <= corePoolSize 且 allowCoreThreadTimeOut=false 时使用 take() 无限阻塞（不会因超时返回 null，从而维持线程数量不低于 corePoolSize）；workerCount > corePoolSize 时使用 poll(keepAliveTime)，超时则线程退出。
退出检查下限：processWorkerExit() 方法中，正常退出时以 corePoolSize 作为最小保有量检查，低于此值则补充线程。

线程增加路径

路径	触发点	`addWorker` 参数	说明
正常增加-核心	`execute()` 步骤1	`(command, true)`	`workerCount < corePoolSize` 时
正常增加-非核心	`execute()` 步骤3	`(command, false)`	队列已满且 `workerCount < maximumPoolSize` 时
正常增加-补偿	`execute()` 步骤2	`(null, false)`	入队后发现 `workerCount == 0` 时
异常增加	`processWorkerExit()`	`(null, false)`	异常退出后补充，保量

线程退出路径

路径	触发点	是否检查 `min`	结果
正常退出	`getTask()` 返回 null	是	若 `workerCount >= min` 则不补充，否则补充
异常退出	任务抛未捕获异常	否	直接调用 `addWorker(null, false)` 补充

即时补偿机制：异常退出时（completedAbruptly=true），processWorkerExit() 跳过 min 检查，立即调用 addWorker(null, false) 尝试补充线程。这是即时补偿而非延迟补偿——不等待下次任务提交。

即时补偿不等于保证达成。addWorker 可能因以下原因失败：线程工厂返回 null、CAS 竞争失败、已达 maximumPoolSize。此外，allowCoreThreadTimeOut=true 时核心线程可因空闲超时退出，不触发补偿。因此 corePoolSize 是目标保有量而非硬性下限，线程池在任何时刻都不保证 workerCount >= corePoolSize。补偿失败时，线程数短暂低于 corePoolSize，由后续 execute() 步骤1（workerCount < corePoolSize 时优先创建）作为兜底策略。

allowCoreThreadTimeOut 的作用

allowCoreThreadTimeOut 是改变核心线程生命周期策略的关键也是唯一的开关：

getTask() 中的 timed 变量：boolean timed = allowCoreThreadTimeOut || wc > corePoolSize
processWorkerExit() 中的 min 变量：int min = allowCoreThreadTimeOut ? 0 : corePoolSize

当 allowCoreThreadTimeOut=true 时：

所有线程（无论是否达到 corePoolSize）都使用 poll(keepAliveTime) 等待任务
正常退出时 min=0，不强制保有核心线程
队列非空时 min=1，至少保留一个消费者

结论

corePoolSize 是目标保有量而非硬性下限。线程池在任何时刻都不保证 workerCount >= corePoolSize，原因包括：

allowCoreThreadTimeOut=true 时核心线程可因空闲超时退出
任务执行异常导致线程退出，processWorkerExit() 虽会补充但可能失败
线程工厂返回 null 导致 addWorker 失败

graph TB
    subgraph 增加路径[线程增加路径]
        exec1["execute() 步骤1<br/>wc < corePoolSize"]
        exec2["execute() 步骤2<br/>入队后 wc == 0"]
        exec3["execute() 步骤3<br/>队列满"]
        abrupt["processWorkerExit()<br/>异常退出"]
        add1["addWorker(cmd, true)<br/>🆕 NEW → RUNNABLE"]
        add2["addWorker(null, false)<br/>🆕 NEW → RUNNABLE"]
        add3["addWorker(cmd, false)<br/>🆕 NEW → RUNNABLE"]
        add4["addWorker(null, false)<br/>🆕 NEW → RUNNABLE"]
        exec1 --> add1
        exec2 --> add2
        exec3 --> add3
        abrupt --> add4
    end

    subgraph 退出路径[线程退出路径]
        gettask["getTask() 返回 null<br/>🔚 即将 TERMINATED"]
        process["processWorkerExit():<br/>if (!completedAbruptly) {<br/>  min = allowCoreThreadTimeOut<br/>      ? 0 : corePoolSize<br/>  if (wc >= min) return;<br/>}<br/>addWorker(null, false)"]
        result["补充成功: wc 恢复<br/>补充失败: wc < min<br/>☠️ TERMINATED"]
        gettask --> process
        process --> result
    end

    subgraph 配置影响[allowCoreThreadTimeOut 影响点]
        timed["getTask(): timed = allowCoreThreadTimeOut || wc > corePoolSize"]
        mincalc["processWorkerExit(): min = allowCoreThreadTimeOut ? 0 : corePoolSize"]
        behavior_false["false (默认): workerCount <= corePoolSize 时使用 take() 无限阻塞<br/>⏳ WAITING"]
        behavior_true["true: 所有线程使用 poll(timeout)，核心线程可因空闲超时退出<br/>⏱️ TIMED_WAITING"]
    end

线程执行

执行任务流程.png

线程的执行强依赖于 Worker 本身的实现。

Worker 类定义与锁状态

Worker 与 Thread 的关系：Worker 不是线程，它是一个包装器。

// 关键证据：Worker 构造函数
Worker(Runnable firstTask) {
    this.thread = getThreadFactory().newThread(this);  // Worker 作为 Runnable 传给 Thread
    // 这一步没有启动线程，由 addWorker 启动。
}

newThread(this) 中，this 是 Worker 对象本身。因为 Worker 实现了 Runnable，所以 Worker 是 Thread 的 target。

概念	实际角色
Worker	包装器 + Runnable，封装任务获取和执行逻辑
Worker.thread	真正的线程对象，由 ThreadFactory 创建
Worker 与 Thread	组合关系：Worker 持有 Thread，同时也是 Thread 的 target
Worker 的锁	不可重入互斥锁，基于 AQS 实现

互相引用关系：

flowchart TB
    subgraph Worker["Worker&lt;br&gt;extends AQS&lt;br&gt;implements Runnable"]
        W_FIELDS["Worker 字段:"]
        W_THREAD["- thread: Thread"]
        W_TASK["- firstTask: Runnable"]
        W_STATE["- state: int"]
        W_COMPLETED["- completedTasks: long"]
        
        W_METHODS["Worker 方法:"]
        W_RUN["+ run() { runWorker(this) }"]
    end
    
    subgraph Thread["Thread"]
        T_FIELDS["Thread 字段:"]
        T_TARGET["- target: Runnable"]
        
        T_METHODS["Thread 方法:"]
        T_RUN["+ run() { target.run() }"]
    end
    
    %% Worker 持有 Thread 引用
    W_THREAD -->|持有| T_TARGET
    
    %% Thread.target 指向 Worker
    T_TARGET -.->|指向| W_FIELDS
    
    %% 构造流程
    W_FIELDS@{ shape: braces}
    
    subgraph Construction["构造流程"]
        C1["new Worker(firstTask)"]
        C2["setState(-1)"]
        C3["this.thread = getThreadFactory.newThread(this)"]
        C4["Thread.target = this"]
        
        C1 --> C2 --> C3 --> C4
    end
    
    %% 执行链路
    C4 -.->|启动| T_RUN
    T_RUN -.->|调用| W_RUN

Worker.thread → Thread（持有引用）
Thread.target → Worker（持有引用，因为 Worker 实现了 Runnable）

循环引用与 GC 回收分析：

flowchart LR
    subgraph GC["GC Roots 可达性分析"]
        APP["应用程序引用<br/>executor"] --> TPE["ThreadPoolExecutor"]
        TPE --> WORKERS["workers"]
        WORKERS --> W["Worker"]
        W -->|"thread"| T["Thread"]
        T -.->|"target"| W
    end
    
    Note1["循环引用不导致泄漏：JVM 用可达性分析，非引用计数"]
    Note2["ThreadLocal 泄漏需警惕：任务结束务必调用 remove()"]
    
    style Problem fill:#ffebee,stroke:#f44336,stroke-width:2px
    style Solution fill:#e8f5e9,stroke:#4caf50,stroke-width:2px

关键洞察：

Worker-Thread 循环引用本身安全：GC 可达性分析能正确处理
ThreadLocal 泄漏需要警惕：线程池中线程复用，ThreadLocal 数据可能残留
最佳实践：在线程池任务中使用 ThreadLocal 时，务必在 finally 块中调用 remove()

执行链路：

addWorker(task, core)
    → new Worker(task)
    → newThread(this)      // Worker 作为 Thread 的 target
    → thread.start()
    → Thread.run()
    → target.run()         // target = Worker
    → Worker.run()
    → runWorker(this)
    → while ((task = getTask()) != null) task.run()

这种设计让 Worker 既能控制线程的中断行为（通过 AQS 锁状态），又能将任务执行委托给线程池的 runWorker 方法。

 /**
  * Worker 类维护线程运行任务时的中断控制状态，以及其他次要的簿记工作。
  * 该类借助扩展 AbstractQueuedSynchronizer 来简化任务执行周围的锁获取和释放。
  * 这可以防止本来用于唤醒等待任务的工作线程的中断，却错误地中断正在执行的任务。
  * 我们实现了一个简单的不可重入互斥锁，而不是使用 ReentrantLock，
  * 因为不希望工作任务在调用 setCorePoolSize 等池控制方法时能够重新获取锁。
  * 此外，为了在线程实际开始运行任务之前抑制中断，将锁状态初始化为负值，并在 runWorker 中清除它。
  *
  * Class Worker mainly maintains interrupt control state for
  * threads running tasks, along with other minor bookkeeping.
  * This class opportunistically extends AbstractQueuedSynchronizer
  * to simplify acquiring and releasing a lock surrounding each
  * task execution.  This protects against interrupts that are
  * intended to wake up a worker thread waiting for a task from
  * instead interrupting a task being run.  We implement a simple
  * non-reentrant mutual exclusion lock rather than use
  * ReentrantLock because we do not want worker tasks to be able to
  * reacquire the lock when they invoke pool control methods like
  * setCorePoolSize.  Additionally, to suppress interrupts until
  * the thread actually starts running tasks, we initialize lock
  * state to a negative value, and clear it upon start (in
  * runWorker).
  */
 private final class Worker
     extends AbstractQueuedSynchronizer
     implements Runnable
 {
     /**
      * This class will never be serialized, but we provide a
      * serialVersionUID to suppress a javac warning.
      *
      * <p>此类永远不会被序列化，但提供 serialVersionUID 以抑制 javac 警告。
      */
     private static final long serialVersionUID = 6138294804551838833L;

     /**
      * Thread this worker is running in.  Null if factory fails.
      *
      * <p>Worker 运行所在的线程，如果工厂失败则为 null。
      */
     final Thread thread;
     /**
      * Initial task to run.  Possibly null.
      *
      * <p>初始任务，可能为 null。
      */
     Runnable firstTask;
     /**
      * Per-thread task counter
      *
      * <p>每线程任务计数器。
      */
     volatile long completedTasks;

     /**
      * Creates with given first task and thread from ThreadFactory.
      * @param firstTask the first task (null if none)
      *
      * <p>使用给定的首个任务和 ThreadFactory 创建线程。
      */
     Worker(Runnable firstTask) {
         // setState(-1) 禁止中断，直到 runWorker 解锁
         setState(-1); // inhibit interrupts until runWorker
         this.firstTask = firstTask;
         this.thread = getThreadFactory().newThread(this);
     }

     /**
      * Delegates main run loop to outer runWorker.
      *
      * <p>将主运行循环委托给外部的 runWorker。这个 runWorker 是线程池的方法，不是 worker 的方法。
      * 这样 worker 的 run 生命周期的修改其实是线程池负责的，worker 自身不负责任何 run 的业务逻辑。
      * 线程在 addWorker 中通过 t.start() 启动，JVM 调用 Thread.run()，再调用 Worker.run()。
      */
     public void run() {
         runWorker(this);
     }

     // Lock methods
     // 锁状态：-1 = 初始化禁止中断，0 = 未锁定，1 = 已锁定
     // -1: 构造时的初始状态，禁止中断
     // 0: 未锁定状态（允许中断）
     // 1: 已锁定状态（正在执行任务）
     // The value 0 represents the unlocked state.
     // The value 1 represents the locked state.

     protected boolean isHeldExclusively() {
         // state != 0 表示被持有（包括 -1 启动状态）
         return getState() != 0;
     }
     
     // AQS 加锁：CAS 0→1，成功则绑定当前线程
     protected boolean tryAcquire(int unused) {
         if (compareAndSetState(0, 1)) {
             setExclusiveOwnerThread(Thread.currentThread());
             return true;
         }
         return false;
     }

     // AQS 解锁：清空持有者，设置 state=0（无 CAS，因为只有持有者能解锁）
     protected boolean tryRelease(int unused) {
         setExclusiveOwnerThread(null);
         setState(0);
         return true;
     }

     public void lock()        { acquire(1); }
     public boolean tryLock()  { return tryAcquire(1); }
     public void unlock()      { release(1); }
     public boolean isLocked() { return isHeldExclusively(); }
     
     // 中断已启动的 Worker（state >= 0）
     void interruptIfStarted() {
         Thread t;
         // state >= 0 表示已启动（非 -1 初始状态）
         if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
             try {
                 t.interrupt();
             } catch (SecurityException ignore) {
             }
         }
     }
}

Worker 锁对中断的保护机制：

核心结论：Worker 继承 AQS，利用 state 字段区分空闲/忙碌状态，实现对执行中任务的中断保护。

state	线程状态	tryLock	是否被中断
1	执行任务中	失败	不中断（受保护）
0	阻塞在 getTask() 等待任务	成功	可中断

所谓"空闲线程"即阻塞在队列上等待任务的线程。Worker线程只有两种状态：执行任务中，或阻塞在getTask()等待任务，不存在"空闲但不阻塞"的第三种状态。shutdown() 通过 tryLock() 识别空闲线程并发送中断，唤醒它们检查线程池状态后退出。执行中的线程因 tryLock 失败被跳过，任务得以正常完成。

Worker 类注释中提到"这可以防止本来用于唤醒等待任务的工作线程的中断，却错误地中断正在执行的任务"。具体保护机制如下：

shutdown() 调用 interruptIdleWorkers() 时，通过 tryLock() 检测 Worker 锁状态：

// shutdown() 的中断逻辑
private void interruptIdleWorkers(boolean onlyOne) {
    for (Worker w : workers) {
        Thread t = w.thread;
        if (w.tryLock()) {  // tryLock 内部调用 tryAcquire，如果试锁不成功，就不是空闲线程
            try {
                t.interrupt();  // 只有 tryLock 成功才中断
            } catch (SecurityException ignore) {
            } finally {
                w.unlock();
            }
        }
        // tryLock 失败 = state=1 = 正在执行任务 → 跳过，不中断
    }
}

tryLock() 调用 tryAcquire()，其实现决定了谁能被中断：

这就是注释所说的"防止错误中断"：shutdown() 发送的中断信号只作用于空闲线程（唤醒它们检查池状态），不会干扰正在执行的任务。所谓唤醒，是唤醒阻塞在 getTask() 中的线程，让它们检查线程池状态后决定是否退出。被中断后，线程会检查 runState：若为 STOP 状态则直接退出；若为 SHUTDOWN 状态，队列为空时才退出，队列非空时可能继续处理完剩余任务。

Worker 生命周期状态图：

stateDiagram-v2
    [*] --> Created: new Worker(firstTask)
    
    Created --> Initialized: setState(-1)<br/>禁止中断
    Initialized --> Started: thread.start()
    
    Started --> Running: runWorker(this)
    Running --> Unlocked: w.unlock()<br/>允许中断
    
    state Running {
        Unlocked --> WaitingTask: getTask()
        WaitingTask --> GotTask: task != null
        WaitingTask --> NoTask: task == null
        
        GotTask --> Locked: w.lock()
        Locked --> Executing: task.run()
        Executing --> Unlocked: w.unlock()
    }
    
    NoTask --> Exiting: processWorkerExit()
    Exiting --> [*]: 线程终止
    
    note right of Created
        Worker 构造时：
        1. setState(-1) 禁止中断
        2. 保存 firstTask
        3. 通过 ThreadFactory 创建线程
    end note
    
    note right of WaitingTask
        getTask() 返回 null 的情况：
        1. 线程数 > maximumPoolSize
        2. 线程池 STOP 状态
        3. 线程池 SHUTDOWN 且队列空
        4. 等待超时
    end note

Worker 锁状态转换图：

graph TD
    subgraph Worker锁状态
        A[state = -1<br/>初始化状态] -->|w.unlock| B[state = 0<br/>空闲状态]
        B -->|w.lock| C[state = 1<br/>执行任务中]
        C -->|w.unlock| B
    end
    
    subgraph 锁状态含义
        D[-1: 禁止中断<br/>Worker刚创建] 
        E[0: 允许中断<br/>Worker空闲等待任务]
        F[1: 正在执行任务<br/>不应被中断]
    end
    
    subgraph 中断规则
        G[interruptIfStarted] --> H{getState >= 0?}
        H -->|是| I[可以中断]
        H -->|否| J[不能中断]
    end
    
    style A fill:#FFB6C1
    style B fill:#90EE90
    style C fill:#87CEEB

Worker 锁的三大功能：

状态标记：isLocked() 判断 Worker 是否正在执行任务
中断保护：interruptIfStarted() 检查 state >= 0 才允许中断
并发控制：interruptIdleWorkers() 用 tryLock() 判断是否可安全中断

为什么必须用不可重入锁？

关键在于 setCorePoolSize 等池控制方法内部会调用 interruptIdleWorkers：

public void setCorePoolSize(int corePoolSize) {
    // ...
    if (workerCountOf(ctl.get()) > corePoolSize)
        interruptIdleWorkers();  // ← 会调用！
}

假设用户任务中调用线程池控制方法：

1
2
3

executor.submit(() -> {
    executor.setCorePoolSize(10);  // 用户任务中调用池控制方法
});

如果用 ReentrantLock（可重入）：

runWorker: w.lock() → state=1
  task.run() → setCorePoolSize() → interruptIdleWorkers()
    → w.tryLock() → 成功（可重入，state=2）→ t.interrupt()
    → 正在执行任务的线程被错误中断！

使用 不可重入锁：

runWorker: w.lock() → state=1
  task.run() → setCorePoolSize() → interruptIdleWorkers()
    → w.tryLock() → CAS(0,1) 失败（state=1）→ 返回 false
    → 跳过这个 Worker，不中断 → 正确！

不可重入的实现原理：

对比 Worker 与 ReentrantLock 的 tryAcquire 实现：

// Worker.tryAcquire（不可重入）
protected boolean tryAcquire(int unused) {
    if (compareAndSetState(0, 1)) {  // 只尝试 0→1
        setExclusiveOwnerThread(Thread.currentThread());
        return true;
    }
    return false;  // 失败就是失败，不检查持有者
}

// ReentrantLock.tryAcquire（可重入）
protected final boolean tryAcquire(int acquires) {
    final Thread current = Thread.currentThread();
    int c = getState();
    if (c == 0) {
        if (compareAndSetState(0, acquires)) {
            setExclusiveOwnerThread(current);
            return true;
        }
    }
    // ====== 关键差异：检查当前线程是否已持有锁 ======
    else if (current == getExclusiveOwnerThread()) {
        int nextc = c + acquires;  // 增加重入计数
        setState(nextc);
        return true;  // 同一线程可以再次获取
    }
    return false;
}

不可重入的实现：就是不写 else if (current == getExclusiveOwnerThread()) 这段代码。Worker 的 tryAcquire 只有前半部分。

为什么选择 AQS 而非 volatile + CAS？

AQS 的 compareAndSetState 本质就是 volatile + Unsafe CAS：

// AQS 源码
protected final boolean compareAndSetState(int expect, int update) {
    return UNSAFE.compareAndSwapInt(this, stateOffset, expect, update);
}

所以 Worker 实际上就在用 volatile int + CAS，AQS 只是做了封装。选择 AQS 是 Doug Lea 的工程风格——复用已有框架，避免手写 Unsafe 获取和反射。这不是"必须"，是"够用且简洁"。AQS 的 exclusiveOwnerThread 对 Worker 来说不重要（不可重入锁不需要记录持有者）。

空闲线程的两种等待状态：

// getTask() 中的阻塞等待
Runnable r = timed ?
    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :  // TIMED_WAITING
    workQueue.take();                                       // WAITING

场景	阻塞方法	Java Thread 状态	唤醒条件
核心线程（不允许超时）	`queue.take()`	WAITING	队列有任务或被中断
非核心线程 / 允许超时	`queue.poll(timeout)`	TIMED_WAITING	队列有任务或超时或被中断

shutdown vs shutdownNow 的中断策略对比：

两种关闭方法使用不同的中断函数，对 Worker 锁的态度截然不同：

方法	状态转换	中断函数	是否检查锁	state=1 能否中断
`shutdown()`	RUNNING → SHUTDOWN	`interruptIdleWorkers()`	`tryLock()` 检查	否
`shutdownNow()`	RUNNING → STOP	`interruptWorkers()`	不检查	是

// shutdown() 使用 tryLock 检查，比较自律
private void interruptIdleWorkers(boolean onlyOne) {
    for (Worker w : workers) {
        if (w.tryLock()) {  // ← 只有 state=0 才能成功
            t.interrupt();
        }
    }
}

// shutdownNow() 不检查锁，只要不是刚初始化，就直接中断
private void interruptWorkers() {
    for (Worker w : workers) {
        w.interruptIfStarted();  // ← 只要 state >= 0 就中断
    }
}

Worker 中断决策流程图：

flowchart TD
    subgraph shutdown决策
        A1[shutdown()] --> B1[interruptIdleWorkers()]
        B1 --> C1{w.tryLock()?}
        C1 -->|state=0 成功| D1[t.interrupt()]
        C1 -->|state=1 失败| E1[跳过，不中断]
        D1 --> F1[空闲线程退出]
    end
    
    subgraph shutdownNow决策
        A2[shutdownNow()] --> B2[interruptWorkers()]
        B2 --> C2{state >= 0?}
        C2 -->|state=0 或 1| D2[t.interrupt()]
        C2 -->|state=-1| E2[跳过，未启动]
        D2 --> F2[所有已启动线程中断]
    end

关键洞察：Worker 的 AQS 锁只保护 shutdown() 的优雅关闭，不保护 shutdownNow() 的强制关闭。STOP 状态的"更严厉"体现在：无视 Worker 锁，强制中断所有已启动线程。

runWorker 执行流程详解：

sequenceDiagram
    participant TPE as ThreadPoolExecutor
    participant W as Worker
    participant T as Thread
    participant Q as BlockingQueue
    
    Note over W: 构造函数: setState(-1)
    TPE->>W: addWorker(task, core)
    TPE->>T: thread.start()
    T->>W: run()
    W->>TPE: runWorker(this)
    
    TPE->>W: w.unlock() // setState(0)
    Note over W: 现在允许中断
    
    loop 任务循环
        alt 有 firstTask
            TPE->>TPE: task = firstTask
        else 无 firstTask
            TPE->>Q: getTask()
            Q-->>TPE: task 或 null
        end
        
        alt task != null
            TPE->>W: w.lock() // setState(1)
            Note over W: 执行期间不应中断
            
            TPE->>TPE: beforeExecute(thread, task)
            TPE->>T: task.run()
            TPE->>TPE: afterExecute(task, thrown)
            
            TPE->>W: w.unlock() // setState(0)
            TPE->>W: completedTasks++
        else task == null
            Note over TPE: 退出循环
        end
    end
    
    TPE->>TPE: processWorkerExit(w, completedAbruptly)
    Note over W: Worker 生命周期结束

runWorker 主循环

Worker 的 run 方法委托给线程池的 runWorker 执行。执行流程如图所示，包含以下关键步骤：

开始：线程启动-这个线程是在 addWorker 方法里被启动的。
申请任务：首次使用 firstTask，后续通过 getTask() 获取
是否申请到了新任务：判断 task 是否为 null
申请Worker非重入锁：w.lock()，state 从 0 → 1
线程池是否至少于STOP后状态：检查是否需要中断
执行任务：调用 task.run()
释放Worker非重入锁：w.unlock()，state 从 1 → 0
任务结束：完成一次任务，继续循环或退出
到线终线程：processWorkerExit()
结束：线程终止

/**
 * Main worker run loop.  Repeatedly gets tasks from queue and executes them.
 *
 * <p>Worker 主运行循环：反复从队列获取任务并执行。核心流程：
 * <ol>
 *   <li>初始任务：可能以 firstTask 开始，否则从 getTask() 获取。
 *       除了内部 addWorker 的几个补偿方法，firstTask 一开始总有</li>
 *   <li>锁保护：执行前加锁防止中断干扰，确保 STOP 状态下线程被中断，
 *       非 STOP 状态下清除中断标志</li>
 *   <li>生命周期钩子：beforeExecute → task.run → afterExecute，
 *       任一环节异常均导致线程死亡。会最终走进线程的 uncaughtExceptionHandler</li>
 *   <li>异常处理：RuntimeException/Error 直接捕获，Throwable 包装为 Error 
 *       交给 UncaughtExceptionHandler</li>
 *   <li>退出逻辑：getTask() 返回 null 时正常退出(completedAbruptly=false)，
 *       异常退出时 processWorkerExit 替换线程</li>
 * </ol>
 *
 * @param w the worker
 */
final void runWorker(Worker w) {
    Thread wt = Thread.currentThread();
    // 取出 firstTask 并置空
    Runnable task = w.firstTask;
    w.firstTask = null;
    // 解除构造时的 setState(-1)，允许中断。这里在没有加锁的时候先调用 unlock 其实是和常规的加解锁语义不一样的，所以 w 并没有实现标准的 Lock 接口。也因此这种默认的 unlock 在 while 循环外只执行一次，while 循环里的 unlock 必须和 lock 对称。
    w.unlock(); // allow interrupts
    // completedAbruptly: 标记线程是否“突然退出”（因异常）
    // - true: 默认值，可能因任务异常、beforeExecute/afterExecute 异常退出
    // - false: 只有 while 循环正常退出（getTask 返回 null）时才设置
    // 默认 true 是安全默认值：若遗漏设置，workerCount 少 1 可自动修复；
    // 若默认 false 且遗漏，异常退出会导致 workerCount 多 1，计数永久错误
    boolean completedAbruptly = true;
    try {
        // getTask 里封装了复杂的取任务流程，本线程只有在 getTask 取不到时才退出
        while (task != null || (task = getTask()) != null) {
            // 步骤4：申请 Worker 非重入锁（对应图中"申请 Worker 非重入锁"）
            // 只在 run 一个 task 的时候锁定自己一次，不可重入
            w.lock();
            // 步骤5：线程池状态检查（对应图中“线程池是否至少于STOP后状态”）
            // If pool is stopping, ensure thread is interrupted;
            // if not, ensure thread is not interrupted.  This
            // requires a recheck in second case to deal with
            // shutdownNow race while clearing interrupt
            //
            // 设计目标：池 >= STOP 时确保 wt 被中断，池 < STOP 时确保 wt 不被中断。
            // 如果看不懂下面，只要看懂上面这句话即可。
            //
            // 为什么不能只用一个 runStateAtLeast 检查？
            // 因为 Thread.interrupted() 有清除中断位的副作用：
            // - 池 >= STOP 时：不应清除中断位，所以第一个条件短路跳过 interrupted()
            // - 池 < STOP 时：必须清除残留中断（任何来源），才调用 interrupted()
            //
            // 为什么清除后还要再检查一次 runStateAtLeast？
            // 第一次 runStateAtLeast 检查到 interrupted() 调用之间存在窗口期，
            // shutdownNow 可能在此期间执行（先更新 ctl 再设置中断）：
            // - 若窗口期内 shutdownNow：interrupted() 清除了中断，重检 ctl 发现 >= STOP，重新设置中断
            // - 若残留中断（非 shutdownNow）：interrupted() 清除了中断，重检 ctl 仍 < STOP，任务正常执行
            //
            // 本段代码与 interruptIfStarted() 的关系：
            // - wt 的中断来源：getTask返回前、task.run()期间由 interruptIfStarted() 直接设置
            // - 本段代码：在 task.run() 前建立正确的初始中断状态（设置或清除）
            // - 重要结论：第二次检查+wt.interrupt()：补偿在 runStateAtLeast(ctl.get(), STOP) 和 Thread.interrupted() 之间被抹去的由 interruptIfStarted() 设置的中断
            // 这是本段代码唯一的“主动设置中断”场景，其他时候要么短路跳过，要么清除残留
            //
            // !wt.isInterrupted() 的作用：
            // Thread.interrupt() 是幂等操作（每次调用设置中断标志为 true），
            // 此检查避免对已中断线程的冗余调用
            if ((runStateAtLeast(ctl.get(), STOP) ||
                 (Thread.interrupted() &&
                  runStateAtLeast(ctl.get(), STOP))) &&
                !wt.isInterrupted())
                // 对应图中"是"分支：线程中断
                wt.interrupt();
            // 对应图中"否"分支：继续执行任务
            // 线程的中断也不会影响接下来的 task.run()
            try {
                // 钩子方法，默认空实现
                beforeExecute(wt, task);
                Throwable thrown = null;
                try {
                    // 步骤6：执行任务（对应图中"执行任务"）
                    task.run();
                } catch (RuntimeException x) {
                    thrown = x; throw x;
                } catch (Error x) {
                    thrown = x; throw x;
                } catch (Throwable x) {
                    // Throwable 无法在 Runnable.run 中重抛，包装为 Error
                    thrown = x; throw new Error(x);
                } finally {
                    // thrown 传给 afterExecute
                    afterExecute(task, thrown);
                }
            } finally {
                // 步骤8：任务结束，清理并解锁
                task = null; 
                // 即使发生异常，completedTasks 也增加
                w.completedTasks++;
                // 步骤7：释放Worker非重入锁（对应图中"释放Worker非重入锁"）
                w.unlock();
            }
        }
        // while 循环正常退出 = getTask 返回 null = 非异常退出
        // 对应图中从"是否申请到了新任务"的"否"分支到"到线终线程"
        // 注意：异常退出时不会执行此行，completedAbruptly 保持 true
        completedAbruptly = false;
    } finally {
        // 步骤9：到线终线程（对应图中"到线终线程"）
        processWorkerExit(w, completedAbruptly);
        // 步骤10：结束（对应图中"结束"）
    }
}

SHUTDOWN 与 STOP 是两种平行的关闭策略

状态	设计意图	任务处理	中断策略
SHUTDOWN	优雅关闭	处理完队列中的任务	仅中断空闲线程
STOP	立即关闭	drainQueue() 并返回未执行任务	中断所有线程（包括执行中的）

设计为平行状态的原因：

使用场景不同：优雅退出 vs 紧急终止
shutdown() 无法中断正在执行的任务，shutdownNow() 则可以
用户根据业务需求选择：正常关闭用 shutdown()，异常/紧急情况用 shutdownNow()

状态跃迁路径（按方法边界组织）：

tryTerminate 触发关闭一个空闲线程，空闲线程退出时 processWorkerExit，又再触发 tryTerminate，周而复始。

问题在于，最初谁触发了 tryTerminate？

答案：ThreadPoolExecutor 消亡全景——tryTerminate() 驱动的传播式关闭

ThreadPoolExecutor 消亡全景图（shutdown / shutdownNow → TERMINATED）
================================================================================================

一、状态转换总览
================================================================================================

RUNNING ──shutdown()──> SHUTDOWN ──(队列空 && wc=0)──> TIDYING ──terminated()──> TERMINATED
   |                       |
   |                       +── 队列非空时 Worker 继续消费，每个 Worker 退出后 tryTerminate() 检查
   |
   +────shutdownNow()──> STOP ────────(wc=0)──────────> TIDYING ──terminated()──> TERMINATED
                           |
                           +── 不管队列，drainQueue() 清空，interruptWorkers() 中断所有线程

================================================================================================

二、shutdown() 触发的消亡流程
================================================================================================

用户调用 shutdown()
   |
   +---> 1. checkShutdownAccess()                    // 安全管理器权限检查
   |
   +---> 2. advanceRunState(SHUTDOWN)                // CAS 循环: RUNNING → SHUTDOWN（不可逆）
   |
   +---> 3. interruptIdleWorkers(false)              // onlyOne=false，中断所有空闲 Worker
   |        |
   |        +---> 获取 mainLock
   |        +---> for (Worker w : workers)
   |        |        +---> w.tryLock()               // 能获取锁 = 空闲（未在执行 task.run()）
   |        |        |      +---> 成功 → w.thread.interrupt() → w.unlock()
   |        |        |      +---> 失败 → 跳过（Worker 正在执行任务，锁被 runWorker 持有）
   |        +---> mainLock.unlock()
   |
   +---> 4. onShutdown()                             // 钩子（ScheduledThreadPoolExecutor 重写）
   |
   +---> 5. tryTerminate()                           // ← 首次终止检查
   |
   v
方法立即返回（异步模式，不等待 Worker 退出）

                    ┌─────────────────────────────────────────────────────────┐
                    │  Worker 线程视角：runWorker() 主循环                      │
                    │                                                         │
                    │  while (task != null || (task = getTask()) != null) {    │
                    │      w.lock();                                          │
                    │      // 检查中断 & 执行 beforeExecute / task.run() /     │
                    │      // afterExecute                                    │
                    │      w.unlock();                                        │
                    │  }                                                      │
                    │  // 循环退出后 → processWorkerExit(w, completedAbruptly) │
                    └─────────────────────────────────────────────────────────┘

Worker 在 getTask() 中感知状态变化
   |
   +---> getTask() 内部逻辑：
   |      |
   |      +---> for (;;) {
   |      |        int c = ctl.get();
   |      |        int rs = runStateOf(c);
   |      |
   |      |        // 关键退出判断
   |      |        if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
   |      |            decrementWorkerCount();
   |      |            return null;          // ← 返回 null 使 runWorker 退出循环
   |      |        }
   |      |
   |      |        // 未满足退出条件时，继续从队列取任务
   |      |        Runnable r = timed ?
   |      |            workQueue.poll(keepAliveTime, NANOSECONDS) :  // 超时返回 null
   |      |            workQueue.take();                              // 阻塞等待
   |      |
   |      |        // 被中断时 take()/poll() 抛 InterruptedException
   |      |        // → catch 后 continue → 回到循环开头重新检查状态
   |      |    }
   |      |
   |      +---> SHUTDOWN + 队列非空 → 继续取任务执行（不退出）
   |      +---> SHUTDOWN + 队列空   → return null（Worker 退出）
   |      +---> STOP（任意队列状态）→ return null（Worker 立即退出）
   |
   v
getTask() 返回 null
   |
   v
runWorker() 退出 while 循环，completedAbruptly = false
   |
   v
processWorkerExit(Worker w, false)
   |
   +---> 获取 mainLock
   +---> workers.remove(w)                           // 从 HashSet<Worker> 移除
   +---> completedTaskCount += w.completedTasks      // 累加统计
   +---> mainLock.unlock()
   |
   +---> 判断是否需要补充 Worker
   |      +---> int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
   |      +---> if (min == 0 && !workQueue.isEmpty()) min = 1;  // 队列非空至少保留 1 个
   |      +---> if (workerCountOf(ctl.get()) >= min) → 不补充
   |      +---> else → addWorker(null, false)        // 补充一个非核心 Worker
   |
   +---> tryTerminate()                              // ← 传播式关闭的核心触发点
            |
            (见下方 tryTerminate 详解)

================================================================================================

三、shutdownNow() 触发的消亡流程
================================================================================================

用户调用 shutdownNow()
   |
   +---> 1. checkShutdownAccess()                    // 安全管理器权限检查
   |
   +---> 2. advanceRunState(STOP)                    // CAS 循环: RUNNING → STOP（不可逆）
   |
   +---> 3. interruptWorkers()                       // 中断所有已启动 Worker（无视锁状态！）
   |        |
   |        +---> 获取 mainLock
   |        +---> for (Worker w : workers)
   |        |        +---> w.interruptIfStarted()    // if (getState() >= 0) thread.interrupt()
   |        |               不检查 tryLock，正在执行任务的线程也会被中断
   |        +---> mainLock.unlock()
   |
   +---> 4. drainQueue()                             // 清空工作队列
   |        |
   |        +---> List<Runnable> taskList = new ArrayList<>();
   |        +---> workQueue.drainTo(taskList);        // 批量转移（线程安全）
   |        +---> while (!q.isEmpty()) {              // 处理 drainTo 漏掉的元素
   |        |        Runnable r = q.poll();
   |        |        if (r != null) taskList.add(r);
   |        |    }
   |        +---> return taskList;                    // 返回所有未执行的任务
   |
   +---> 5. onShutdown()                             // 钩子方法
   |
   +---> 6. tryTerminate()                           // ← 首次终止检查
   |
   v
方法返回 List<Runnable>（被丢弃的任务，调用者可决定取消或重新提交）

Worker 线程被中断（包括正在执行任务的线程）
   |
   +---> 正在执行 task.run() 的 Worker
   |      +---> 任务代码可能抛出 InterruptedException 或忽略中断
   |      +---> 任务结束后回到 getTask()
   |
   +---> 空闲阻塞在 take()/poll() 的 Worker
   |      +---> 抛出 InterruptedException → catch → continue → 重新检查状态
   |
   +---> getTask() 检查: if (rs >= STOP) → decrementWorkerCount() → return null
   |
   v
所有 Worker 最终 getTask() 返回 null → runWorker() 退出 → processWorkerExit() → tryTerminate()

================================================================================================

四、tryTerminate() 内部三阶段逻辑
================================================================================================

tryTerminate()                                       // 被 5 个调用点触发（见下方列表）
   |
   +---> for (;;) {                                  // 无限循环，处理 CAS 竞争
            |
            +---> 【第一阶段：前置拒绝检查】
            |      int c = ctl.get();
            |      |
            |      +---> if (isRunning(c)) return;                    // RUNNING → 不终止
            |      +---> if (runStateAtLeast(c, TIDYING)) return;     // 已 TIDYING/TERMINATED → 不重复
            |      +---> if (SHUTDOWN && !workQueue.isEmpty()) return; // SHUTDOWN+队列非空 → 等队列消费完
            |      |
            |      注意：STOP 状态不在拒绝列表中，STOP 语义 = "不管队列，直接终止"
            |
            +---> 【第二阶段：传播式关闭——逐个中断空闲 Worker】
            |      |
            |      +---> if (workerCountOf(c) != 0) {
            |      |        interruptIdleWorkers(ONLY_ONE);           // 只中断一个空闲 Worker
            |      |        |
            |      |        +---> 获取 mainLock
            |      |        +---> for (Worker w : workers) {
            |      |        |        if (w.tryLock()) {               // 空闲的才能获取锁
            |      |        |            w.thread.interrupt();
            |      |        |            w.unlock();
            |      |        |            break;                       // ONLY_ONE=true，只中断一个
            |      |        |        }
            |      |        |    }
            |      |        +---> mainLock.unlock()
            |      |
            |      |        return;  // 等待被中断的 Worker 退出后再次触发 tryTerminate()
            |      |    }
            |      |
            |      为什么只中断一个？
            |      - 避免唤醒风暴：批量中断导致大量线程同时苏醒竞争 mainLock
            |      - 锁持有时间短：只遍历到第一个空闲线程即释放
            |      - 链式反应保证最终终止：被中断 Worker 退出 → processWorkerExit → tryTerminate
            |        → 再中断下一个 → 周而复始直到 wc=0
            |      - Javadoc: "To guarantee eventual termination, it suffices to always
            |        interrupt only one idle worker."
            |
            +---> 【第三阶段：workerCount=0，执行状态转换】
                   |
                   +---> 获取 mainLock
                   +---> CAS: ctl → ctlOf(TIDYING, 0)
                   |      +---> CAS 成功:
                   |      |      +---> terminated()                   // 钩子方法（默认空实现）
                   |      |      +---> ctl.set(ctlOf(TERMINATED, 0))  // 最终状态
                   |      |      +---> termination.signalAll()        // 唤醒 awaitTermination() 等待者
                   |      |      +---> return
                   |      +---> CAS 失败:
                   |             +---> mainLock.unlock()
                   |             +---> continue                       // 重试外层循环
                   |                    （下一轮会因 runStateAtLeast(TIDYING) 直接 return）

================================================================================================

五、传播式关闭——链式反应全过程
================================================================================================

shutdown()/shutdownNow() 调用 tryTerminate()
   |
   +---> tryTerminate(): wc > 0 → interruptIdleWorkers(ONLY_ONE) → 中断 Worker1
          |
          v
Worker1: take()/poll() 抛 InterruptedException → getTask() 检查状态 → return null
          |
          v
Worker1: runWorker() 退出循环 → processWorkerExit(Worker1)
          |
          +---> workers.remove(Worker1)
          +---> tryTerminate(): wc > 0 → interruptIdleWorkers(ONLY_ONE) → 中断 Worker2
                 |
                 v
Worker2: 同上流程 → processWorkerExit(Worker2)
                 |
                 +---> tryTerminate(): wc > 0 → 中断 Worker3
                        |
                        v
                       ... 周而复始 ...
                        |
                        v
WorkerN（最后一个）: processWorkerExit(WorkerN)
                        |
                        +---> tryTerminate(): wc == 0
                               |
                               +---> CAS: SHUTDOWN/STOP → TIDYING
                               +---> terminated()                    // 钩子
                               +---> TIDYING → TERMINATED
                               +---> termination.signalAll()         // 唤醒 awaitTermination()

================================================================================================

六、异常退出路径（task.run() 抛出未捕获异常）
================================================================================================

runWorker() 中 task.run() 抛出 RuntimeException/Error
   |
   +---> completedAbruptly = true（默认值，未被设为 false）
   +---> finally: processWorkerExit(w, true)
          |
          +---> decrementWorkerCount()               // 异常退出需手动减 wc（正常退出在 getTask 中减）
          +---> workers.remove(w)
          +---> 判断补充: completedAbruptly=true → addWorker(null, false) 补充一个 Worker
          +---> tryTerminate()                        // 同样触发终止检查

================================================================================================

七、tryTerminate() 的所有调用点
================================================================================================

                              tryTerminate()
                                    ^
                                    |
          +----------+--------------+--------------+------------------+
          |          |              |              |                  |
     shutdown()  shutdownNow()  processWorker   purge()          remove()
                                Exit()
          |          |              |              |                  |
          |          |              |              |                  |
     状态→SHUTDOWN  状态→STOP    每个Worker     清理已取消的      从队列移除
     中断空闲线程   中断所有线程  退出时触发     Future任务后      指定任务后
     首次检查       清空队列      传播式关闭     队列可能变空      队列可能变空
                    首次检查      的核心         触发终止检查      触发终止检查

     另外：addWorkerFailed() 也会调用 tryTerminate()
           （Worker 创建/启动失败时 wc 可能变为 0）

================================================================================================

八、两种关闭路径对比
================================================================================================

                    shutdown()                          shutdownNow()
                    ──────────                          ─────────────
  状态转换          RUNNING → SHUTDOWN                  RUNNING → STOP
  中断方法          interruptIdleWorkers(false)          interruptWorkers()
  中断范围          仅空闲线程（w.tryLock() 检查）       所有已启动线程（无视锁）
  队列处理          Worker 继续消费直到队列空            drainQueue() 直接清空
  返回值            void                                List<Runnable>（被丢弃的任务）
  终止条件          队列空 && wc=0                       wc=0（不管队列）

================================================================================================

ThreadPoolExecutor 消亡机制要点：

tryTerminate() 是条件检查而非强制关闭：内部判断 runState >= SHUTDOWN && workerCount == 0 才执行终止。每次 workerCount 可能变为 0 的操作后都会调用它，形成多次检查、最终触发的模式
tryTerminate() 的所有调用点：
- shutdown()：状态置为 SHUTDOWN 后，检查是否可立即终止（队列为空且无 Worker）
- shutdownNow()：状态置为 STOP 且清空队列后，检查是否可立即终止（workerCount=0）
- processWorkerExit()：每个 Worker 退出时，传播终止信号，检查是否最后一个 Worker——这是传播式关闭的核心
- addWorkerFailed()：Worker 创建/启动失败时，workerCount 可能变为 0，检查终止条件
- purge()：清理已取消的 Future 任务后，队列可能变空，SHUTDOWN 状态下可触发终止
- remove()：从队列移除指定任务后，队列可能变空，SHUTDOWN 状态下可触发终止
drainQueue() 的作用：shutdownNow() 调用，将队列中所有未执行的任务通过 BlockingQueue.drainTo() 批量转移到 List 中返回，调用者可决定取消或重新提交
interruptIdleWorkers() 不一定导致线程退出：中断只是唤醒线程，线程被唤醒后在 getTask() 循环中检查状态：
- SHUTDOWN + 队列非空 → 继续从队列取任务执行（不退出）
- SHUTDOWN + 队列空 → return null，线程退出
- STOP（任意队列状态） → return null，线程立即退出
interruptIdleWorkers(ONLY_ONE) 为什么只中断一个？：这是 tryTerminate() 内部的补充机制。shutdown() 已调用 interruptIdleWorkers(false) 中断所有空闲线程，此处处理后续仍有线程存活的情况。只中断一个的原因：避免唤醒风暴（批量中断导致大量线程同时苏醒竞争 mainLock）、锁持有时间短、链式反应保证最终终止。Javadoc 原文：“To guarantee eventual termination, it suffices to always interrupt only one idle worker.”
idle 线程如何响应中断？：idle 线程阻塞在 getTask() 的 workQueue.take() 或 workQueue.poll() 上。中断后抛出 InterruptedException，被 catch 捕获后 continue 回到循环开头，检查状态 if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty()))，满足条件返回 null
getTask() 返回 null 后 Worker 如何退出？：runWorker() 的 while 循环条件不满足 → 退出循环 → completedAbruptly = false → processWorkerExit() → 从 workers 移除、更新统计、调用 tryTerminate() → runWorker() 方法返回，线程自然结束
异常退出路径：task.run() 抛出未捕获异常时，completedAbruptly = true（默认值未被设为 false），processWorkerExit() 中会 decrementWorkerCount()（正常退出在 getTask 中减）并 addWorker(null, false) 补充一个 Worker
关闭流程的本质：状态先变、退出分散的异步模式。advanceRunState() 后调用方立即返回，不会被阻塞等待。线程池进入关闭状态（不可逆），各线程在自然执行节点逐步感知状态变化并退出——这是最终一致性设计
最后一个退出的 Worker 触发 TIDYING → TERMINATED 转换。tryTerminate() 确保任何导致 workerCount 减少的操作都有机会触发终止检查，避免线程池永远卡在 SHUTDOWN 状态

尝试关闭 ThreadPoolExecutor

关闭流程的本质：状态先变、退出分散的异步模式。

advanceRunState(SHUTDOWN/STOP) 后，调用方立即返回，不会被阻塞等待。线程池进入关闭状态（不可逆），各线程在自然执行节点逐步感知状态变化并退出：

退出触发点	触发机制	说明
`getTask()` 阻塞中被中断	`interruptIdleWorkers()` 唤醒	检查状态后退出
`getTask()` 队列空返回 null	自然感知	SHUTDOWN + 队列空 → 退出
任务执行完毕后回到 `getTask()`	自然感知	检查状态后退出
`processWorkerExit()` → `tryTerminate()`	传播式关闭	中断下一个空闲线程

这是最终一致性设计：不强制同步等待，而是让线程在自然执行节点逐步退出。优点：调用方快速返回、降低峰值压力、自然处理边缘情况（SHUTDOWN 下长任务正常完成）。

/**
 * Transitions to TERMINATED state if either (SHUTDOWN and pool
 * and queue empty) or (STOP and pool empty).  If otherwise
 * eligible to terminate but workerCount is nonzero, interrupts an
 * idle worker to ensure that shutdown signals propagate. This
 * method must be called following any action that might make
 * termination possible -- reducing worker count or removing tasks
 * from the queue during shutdown. The method is non-private to
 * allow access from ScheduledThreadPoolExecutor.
 *
 * 状态转换条件：(SHUTDOWN && 队列空) 或 (STOP && workerCount=0)。
 * 若可终止但 workerCount > 0，则中断一个空闲 worker 以确保关闭信号传播。
 *
 * 调用时机：
 * - shutdown() / shutdownNow()：这是2个，而且调用会最终走入 processWorkerExit，进入循环
 * - addWorkerFailed()：worker 创建失败时
 * - processWorkerExit()：每个 worker 退出时，传播式关闭的关键触发点
 * - ScheduledThreadPoolExecutor.onShutdown()：子类重写的钩子，取消延迟任务后检查终止条件
 */
final void tryTerminate() {
    // 无限循环用于处理 CAS 竞争失败；三个 return 分支分别对应不同的退出条件
    for (;;) {
        int c = ctl.get();
        // 第一阶段：前置拒绝检查：排除不能关闭的情况，可能退出
        // 不能关闭的三种情况：
        // 1. isRunning(c)：RUNNING 状态，线程池正常运行中。所以一般的线程消亡不会 terminate
        // 2. runStateAtLeast(c, TIDYING)：已处于 TIDYING 或 TERMINATED，无需再关闭。竞态条件下已经有其他线程开始推进 TIDYING 流程，也不处理。
        // 3. SHUTDOWN 但队列非空：需要先处理完队列中的任务。有任务仍需处理，静观其变。
        // 注意：STOP 状态不在排除列表中——STOP 本身就是"可关闭"状态，其语义是"不处理队列，中断所有线程"
        // 关闭条件：(SHUTDOWN && 队列空) 或 (STOP)——两者都要求 workerCount 最终归零
        if (isRunning(c) ||
            runStateAtLeast(c, TIDYING) ||
            (runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty()))
            return;

        // 第二阶段：确保 wc 降到 0    
        // 传播式关闭：只要 wc > 0，就只中断一个空闲线程后返回
        // 
        // 【为什么是补充机制？】
        // shutdown() 已调用 interruptIdleWorkers()（无参数版本）中断所有空闲线程。
        // 此处 interruptIdleWorkers(ONLY_ONE) 处理后续仍有线程存活的情况
        // （如队列非空时线程继续处理任务，处理完后阻塞在 getTask()）。
        // 
        // 【为什么只中断一个而非全部？】
        // - 锁持有时间短：只遍历找到一个空闲线程即释放 mainLock
        // - 避免唤醒风暴：线程逐个退出，竞争分散；批量中断会导致大量线程同时苏醒竞争同一把锁
        // - 符合渐进式终止：被中断线程退出后调用 processWorkerExit() → tryTerminate()，
        //   形成连锁反应，逐步关闭所有线程，最终 wc=0 进入 TIDYING→TERMINATED
        if (workerCountOf(c) != 0) { // Eligible to terminate
            interruptIdleWorkers(ONLY_ONE);
            return;
        }

        // 第三阶段：进入下一状态
        // workerCount = 0，执行真正的状态转换：TIDYING → TERMINATED
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            // CAS 将状态转换为 TIDYING，workerCount 保持为 0
            // CAS 失败说明其他线程已修改 ctl，需重试外层循环
            if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
                try {
                    // 通常是一个空钩子方法，这两个状态之间就差了一个钩子设计。所以 TIDYING 本身并没有做什么事。
                    terminated();
                } finally {
                    // 再设置为 TERMINATED
                    ctl.set(ctlOf(TERMINATED, 0));
                    // 已关闭才做 signalAll()。termination 是一个 condition
                    termination.signalAll();
                }
                return;
            }
        } finally {
            mainLock.unlock();
        }
        // CAS 失败说明有其他线程抢先完成了状态转换，当前线程直接进入下一轮循环重试
        // 注意：由于 workerCount=0 是进入此分支的前提，CAS 竞争只会发生在多个线程同时调用 tryTerminate 时
        // 最终只有一个线程能成功将状态设为 TIDYING，其他线程在下一轮循环中会因 runStateAtLeast(c, TIDYING) 而返回
    }
}

生命周期钩子方法：beforeExecute / afterExecute / terminated

ThreadPoolExecutor 提供了三个 protected 钩子方法，允许子类在任务执行的关键节点插入自定义逻辑。这是模板方法模式的经典应用。

钩子方法定义与调用时机

/**
 * 任务执行前调用，在此处抛出异常则 task.run() 不会被执行
 * @param t 执行任务的线程
 * @param r 将要执行的任务
 */
protected void beforeExecute(Thread t, Runnable r) { }

/**
 * 任务执行后调用，在 finally 中执行，无论是否抛出异常
 * @param r 已执行的任务
 * @param t task.run() 向外抛出的异常，分两种情况：
 *          <ul>
 *          <li>普通 Runnable：run() 抛 RuntimeException/Error 时 t 为该异常，正常完成时 t 为 null</li>
 *          <li>FutureTask 包装（如通过 submit 提交）：t 始终为 null，
 *              因 FutureTask.run() 捕获 callable.call() 异常作为结果存储，不向外抛出</li>
 *          </ul>
 *          <p><b>异常传播路径对比</b>：task.run() 的异常由 Worker 线程捕获传给 afterExecute；
 *          future.get() 的异常（CancellationException/ExecutionException）由调用方捕获——
 *          二者发生时机、线程视角、异常类型均不同。
 */
protected void afterExecute(Runnable r, Throwable t) { }

/**
 * 线程池终止后调用（所有任务完成且所有 Worker 线程已退出）
 */
protected void terminated() { }

调用时机与执行保证：

sequenceDiagram
    participant TPE as ThreadPoolExecutor
    participant W as Worker
    participant T as Thread
    participant Task as Runnable
    
    TPE->>W: runWorker(this)
    loop 任务循环
        TPE->>TPE: getTask()
        TPE->>W: w.lock()
        
        Note over TPE: === 钩子调用开始 ===
        TPE->>TPE: beforeExecute(thread, task)
        Note right of TPE: 默认空实现<br/>可抛出异常终止任务
        
        alt beforeExecute 正常完成
            TPE->>Task: task.run()
            Task-->>TPE: 正常返回或抛出异常
            TPE->>TPE: afterExecute(task, thrown)
            Note right of TPE: thrown = 捕获的异常<br/>正常完成时为 null
        else beforeExecute 抛出异常
            Note over TPE: 任务不会执行
            TPE->>TPE: afterExecute(task, thrown)
            Note right of TPE: thrown = beforeExecute 的异常
        end
        
        TPE->>W: w.unlock()
        TPE->>W: completedTasks++
    end
    
    TPE->>TPE: processWorkerExit()
    
    alt 线程池进入 TIDYING 状态
        TPE->>TPE: terminated()
        Note right of TPE: 仅调用一次<br/>所有 Worker 已退出
    end

典型应用场景

1. 任务执行时间监控与统计

public class MonitoredThreadPool extends ThreadPoolExecutor {
    
    private final ConcurrentHashMap<Runnable, Long> taskStartTimes = 
        new ConcurrentHashMap<>();
    private final AtomicLong totalExecutionTime = new AtomicLong(0);
    private final AtomicLong taskCount = new AtomicLong(0);
    
    public MonitoredThreadPool(int corePoolSize, int maximumPoolSize,
                               long keepAliveTime, TimeUnit unit,
                               BlockingQueue<Runnable> workQueue) {
        super(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue);
    }
    
    @Override
    protected void beforeExecute(Thread t, Runnable r) {
        super.beforeExecute(t, r);
        // 记录任务开始时间
        taskStartTimes.put(r, System.nanoTime());
        
        // 可添加：线程上下文初始化
        MDC.put("taskStartTime", String.valueOf(System.currentTimeMillis()));
        MDC.put("workerThread", t.getName());
    }
    
    @Override
    protected void afterExecute(Runnable r, Throwable t) {
        try {
            // 计算执行时间
            Long startTime = taskStartTimes.remove(r);
            if (startTime != null) {
                long executionTime = System.nanoTime() - startTime;
                totalExecutionTime.addAndGet(executionTime);
                long count = taskCount.incrementAndGet();
                
                // 记录慢任务
                if (executionTime > TimeUnit.MILLISECONDS.toNanos(100)) {
                    logger.warn("Slow task detected: {}ms, avg: {}ms", 
                        TimeUnit.NANOSECONDS.toMillis(executionTime),
                        TimeUnit.NANOSECONDS.toMillis(totalExecutionTime.get() / count));
                }
            }
            
            // 异常处理
            if (t != null) {
                logger.error("Task execution failed", t);
                // 可添加：失败计数、告警通知
            }
        } finally {
            // 必须调用父类方法（虽然父类是空实现，但保持好习惯）
            super.afterExecute(r, t);
            // 清理线程上下文
            MDC.clear();
        }
    }
    
    @Override
    protected void terminated() {
        // 线程池关闭后的清理工作
        logger.info("ThreadPool terminated. Total tasks: {}, avg execution time: {}ms",
            taskCount.get(),
            TimeUnit.NANOSECONDS.toMillis(totalExecutionTime.get() / Math.max(1, taskCount.get())));
        
        // 可添加：资源释放、指标上报
        super.terminated();
    }
}

2. 线程上下文传递（如 TraceId）

public class ContextAwareThreadPool extends ThreadPoolExecutor {
    
    public ContextAwareThreadPool(int corePoolSize, int maximumPoolSize,
                                  long keepAliveTime, TimeUnit unit,
                                  BlockingQueue<Runnable> workQueue) {
        super(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue);
    }
    
    @Override
    protected void beforeExecute(Thread t, Runnable r) {
        // 从任务中恢复上下文
        if (r instanceof ContextAwareTask) {
            ContextAwareTask task = (ContextAwareTask) r;
            TraceContext.setTraceId(task.getTraceId());
            TraceContext.setSpanId(task.getSpanId());
        }
        super.beforeExecute(t, r);
    }
    
    @Override
    protected void afterExecute(Runnable r, Throwable t) {
        try {
            super.afterExecute(r, t);
        } finally {
            // 清理上下文，防止线程复用时污染
            TraceContext.clear();
        }
    }
}

// 包装任务以携带上下文
public class ContextAwareTask implements Runnable {
    private final Runnable task;
    private final String traceId;
    private final String spanId;
    
    public ContextAwareTask(Runnable task) {
        this.task = task;
        this.traceId = TraceContext.getTraceId();
        this.spanId = TraceContext.generateSpanId();
    }
    
    @Override
    public void run() {
        task.run();
    }
    
    // getters...
}

3. 任务优先级动态调整

public class PriorityThreadPool extends ThreadPoolExecutor {
    
    private final PriorityBlockingQueue<Runnable> priorityQueue;
    
    public PriorityThreadPool(int corePoolSize, int maximumPoolSize) {
        super(corePoolSize, maximumPoolSize, 0L, TimeUnit.MILLISECONDS,
              new PriorityBlockingQueue<>(11, new TaskComparator()));
        this.priorityQueue = (PriorityBlockingQueue<Runnable>) getQueue();
    }
    
    @Override
    protected void beforeExecute(Thread t, Runnable r) {
        super.beforeExecute(t, r);
        // 记录实际开始执行时间，用于计算等待时间
        if (r instanceof PrioritizedTask) {
            ((PrioritizedTask) r).setActualStartTime(System.nanoTime());
        }
    }
    
    @Override
    protected void afterExecute(Runnable r, Throwable t) {
        try {
            if (r instanceof PrioritizedTask) {
                PrioritizedTask task = (PrioritizedTask) r;
                long waitTime = task.getActualStartTime() - task.getSubmitTime();
                long executionTime = System.nanoTime() - task.getActualStartTime();
                
                // 根据等待时间和执行时间动态调整优先级策略
                if (waitTime > TimeUnit.SECONDS.toNanos(1)) {
                    logger.warn("High priority task waited too long: {}ms", 
                        TimeUnit.NANOSECONDS.toMillis(waitTime));
                }
            }
        } finally {
            super.afterExecute(r, t);
        }
    }
    
    static class TaskComparator implements Comparator<Runnable> {
        @Override
        public int compare(Runnable r1, Runnable r2) {
            int p1 = (r1 instanceof PrioritizedTask) ? 
                ((PrioritizedTask) r1).getPriority() : 0;
            int p2 = (r2 instanceof PrioritizedTask) ? 
                ((PrioritizedTask) r2).getPriority() : 0;
            return Integer.compare(p2, p1); // 高优先级在前
        }
    }
}

关键注意事项

1. 异常处理原则

@Override
protected void afterExecute(Runnable r, Throwable t) {
    // 错误：直接吞掉异常
    if (t != null) {
        // 什么都不做
    }
    
    // 正确：记录并处理异常
    if (t != null) {
        logger.error("Task failed: {}", r, t);
        // 可添加：失败重试、死信队列、告警通知
    }
    
    super.afterExecute(r, t);
}

FutureTask 异常处理陷阱： 当提交的任务是 FutureTask（如 submit() 返回的对象）时，异常被封装在 ExecutionException 内部，afterExecute 收到的 Throwable t 参数可能为 null。

@Override
protected void afterExecute(Runnable r, Throwable t) {
    super.afterExecute(r, t);
    
    // 对于 FutureTask，需要额外检查内部异常
    if (t == null && r instanceof Future<?>) {
        try {
            Future<?> future = (Future<?>) r;
            if (future.isDone()) {
                future.get(); // 触发 ExecutionException
            }
        } catch (ExecutionException ee) {
            t = ee.getCause(); // 获取真正的异常
        } catch (CancellationException ce) {
            t = ce; // 任务被取消
        } catch (InterruptedException ie) {
            Thread.currentThread().interrupt();
        }
    }
    
    if (t != null) {
        logger.error("Task execution failed", t);
    }
}

原因分析： FutureTask.run() 内部捕获了所有异常并存储在 outcome 字段中，对外表现为正常完成。只有调用 Future.get() 时才会抛出封装后的 ExecutionException。

2. 阻塞风险

@Override
protected void beforeExecute(Thread t, Runnable r) {
    // 钩子方法在 Worker 线程中同步执行
    // 应避免耗时操作，否则会阻塞任务执行
    
    // 错误：同步调用外部服务
    // externalService.syncCall(); // 阻塞！
    
    // 正确：轻量级操作，异步发送指标
    metricsRecorder.recordTaskStart(r);
}

3. 与 shutdown 的协作

@Override
protected void terminated() {
    // 线程池已完全终止，所有 Worker 线程已退出
    // 此时可以安全地释放资源
    
    // 上报最终统计指标
    metricsReporter.reportFinalStats();
    
    // 关闭关联的资源
    resourceManager.close();
    
    super.terminated();
}

// 使用示例
threadPool.shutdown();
if (threadPool.awaitTermination(60, TimeUnit.SECONDS)) {
    // terminated() 已被调用，资源已清理
    System.out.println("Graceful shutdown completed");
}

4. 入参操纵性说明

各钩子方法的参数操纵能力不同：

钩子方法	参数	可操纵性	修改的影响范围
`beforeExecute(Thread t, Runnable r)`	Thread t	高	影响即将执行的任务线程属性
	Runnable r	中	可读取任务信息、修改自定义任务内部状态
`afterExecute(Runnable r, Throwable t)`	Runnable r	低	任务已执行完，修改无运行时影响
	Throwable t	低	参数是捕获结果的引用，修改不影响原异常传播
`terminated()`	无参数	-	可访问线程池字段进行清理

beforeExecute 入参操纵示例：

@Override
protected void beforeExecute(Thread t, Runnable r) {
    super.beforeExecute(t, r);
    
    // Thread 参数：可操纵线程属性
    t.setName("worker-" + taskIdGenerator.incrementAndGet());
    t.setPriority(Thread.NORM_PRIORITY + 1);
    t.setContextClassLoader(customClassLoader);
    
    // Runnable 参数：类型检查与状态修改
    if (r instanceof TraceableTask) {
        TraceableTask task = (TraceableTask) r;
        task.setStartTime(System.nanoTime()); // 修改任务内部状态
        TraceContext.setTraceId(task.getTraceId());
    }
}

关键约束：

beforeExecute 中抛出异常会导致任务不执行，但 afterExecute 仍会被调用（异常传递给 Throwable 参数）
钩子方法在 Worker 线程中同步执行，修改入参后应避免耗时操作

钩子方法与状态机的关系

stateDiagram-v2
    [*] --> RUNNING: 创建线程池
    
    RUNNING --> SHUTDOWN: shutdown()
    RUNNING --> STOP: shutdownNow()
    
    SHUTDOWN --> TIDYING: 队列为空且所有任务完成
    STOP --> TIDYING: 所有任务完成
    
    TIDYING --> TERMINATED: terminated() 执行完成
    
    note right of RUNNING
        beforeExecute / afterExecute
        在每个任务执行前后调用
    end note
    
    note right of TIDYING
        terminated() 调用点：
        1. 所有 Worker 已退出
        2. 队列已空
        3. 仅调用一次
    end note

核心要点：

beforeExecute / afterExecute：每个任务执行前后调用，用于任务级监控和上下文管理
terminated：线程池完全终止后调用一次，用于资源清理和最终统计
所有钩子都在同步上下文中执行，应避免耗时操作
异常处理要完善，避免影响线程池正常运行

getTask 获取任务

   
/**
 *  阻塞式获取任务。遇到异常情况给上游的返回值是 null：
 * 1. 有超过 maximumPoolSize 的线程数，返回 null 导致线程退出。
 * 2. 线程池 STOP 状态（由 shutdownNow 触发），返回 null 指示线程有序退出。此时即使queue还有任务也不管。
 * 3. 线程池 SHUTDOWN 且队列为空。如果仍然有队列任务，则把任务弹出来交给 wt。
 * 4. 线程超时：allowCoreThreadTimeOut=true 或 workerCount > corePoolSize 且超时。
 * 
 * Performs blocking or timed wait for a task, depending on
 * current configuration settings, or returns null if this worker
 * must exit because of any of:
 * 1. There are more than maximumPoolSize workers (due to
 *    a call to setMaximumPoolSize).
 * 2. The pool is stopped.
 * 3. The pool is shutdown and the queue is empty.
 * 4. This worker timed out waiting for a task, and timed-out
 *    workers are subject to termination (that is,
 *    {@code allowCoreThreadTimeOut || workerCount > corePoolSize})
 *    both before and after the timed wait, and if the queue is
 *    non-empty, this worker is not the last thread in the pool.
 *
 * @return task, or null if the worker must exit, in which case
 *         workerCount is decremented
 */
private Runnable getTask() {
    boolean timedOut = false; // 上次 poll() 是否超时
    for (;;) {
        int c = ctl.get();
        int rs = runStateOf(c);
        
        // 情况 1-3：检查是否需要退出
        // 仅在必要时检查队列是否为空
        if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
            decrementWorkerCount();
            return null;
        }

        int wc = workerCountOf(c);

        // 是否需要超时等待？allowCoreThreadTimeOut 或线程数超过 corePoolSize
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
        // 情况 4：超时或超过最大线程数时退出
        // wc > maximumPoolSize 只在 setMaximumPoolSize() 动态调小时发生
        // addWorker 的原子检查保证正常流程不会超过 maximumPoolSize
        // 调小后，多余线程在下次空闲时被回收
        if ((wc > maximumPoolSize || (timed && timedOut))
            && (wc > 1 || workQueue.isEmpty())) {
            // CAS 减线程数（可能失败）
            if (compareAndDecrementWorkerCount(c))
                return null;
            // CAS 失败，继续循环重试
            continue;
        }

        try {
            // timed=true 使用 poll 超时等待，timed=false 使用 take 阻塞等待
            // 进入 timed，就可能让空闲线程取到 null，取到 null 空闲线程就退出
            Runnable r = timed ?
                workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                workQueue.take();
            if (r != null)
                return r;
            timedOut = true;
        } catch (InterruptedException retry) {
            // 被中断时重置超时标志，继续循环
            timedOut = false;
        }
    }
}

线程回收

中断空闲线程后，线程检查终止条件或配置变更，决定是否退出。

线程池回收线程的过程.png

interruptIdleWorkers 中断空闲线程

共 6 个方法调用：

调用方	调用形式	触发条件	目的
`shutdown()`	`interruptIdleWorkers()`	显式关闭线程池	中断所有空闲线程，让它们检查池状态后退出
`tryTerminate()`	`interruptIdleWorkers(ONLY_ONE)`	终止条件满足但 workerCount > 0	传播式关闭，唤醒一个线程形成退出连锁反应
`setCorePoolSize()`	`interruptIdleWorkers()`	新值 < 当前线程数	回收超出新核心数的多余线程
`setMaximumPoolSize()`	`interruptIdleWorkers()`	新值 < 当前线程数	回收超出新最大数的多余线程
`setKeepAliveTime()`	`interruptIdleWorkers()`	超时时间变更	让空闲线程重新计算超时，可能触发回收
`allowCoreThreadTimeOut()`	`interruptIdleWorkers()`	超时策略变更	让核心线程也参与超时回收

设计动因：通过 tryLock() 检测 Worker 锁状态，仅中断空闲线程，保护正在执行的任务不被错误中断。

/**
 * Interrupts threads that might be waiting for tasks (as
 * indicated by not being locked) so they can check for
 * termination or configuration changes. Ignores
 * SecurityExceptions (in which case some threads may remain
 * uninterrupted).
 *
 * @param onlyOne If true, interrupt at most one worker. This is
 * called only from tryTerminate when termination is otherwise
 * enabled but there are still other workers.  In this case, at
 * most one waiting worker is interrupted to propagate shutdown
 * signals in case all threads are currently waiting.
 * Interrupting any arbitrary thread ensures that newly arriving
 * workers since shutdown began will also eventually exit.
 * To guarantee eventual termination, it suffices to always
 * interrupt only one idle worker, but shutdown() interrupts all
 * idle workers so that redundant workers exit promptly, not
 * waiting for a straggler task to finish.
 *
 * <p>中断可能正在等待任务的线程（通过未锁定来指示），以便它们检查终止或配置变更。
 * 忽略 SecurityException（此时某些线程可能保持未中断）。
 *
 * <p>参数 onlyOne 为 true 时最多中断一个 Worker，仅在 tryTerminate 中调用。
 * 此时终止条件已满足但仍有其他 Worker，最多中断一个等待中的 Worker 以传播关闭信号。
 * 为保证最终终止，始终只中断一个空闲 Worker 即可，
 * 但 shutdown() 会中断所有空闲 Worker，以便冗余 Worker 迅速退出。
 */
private void interruptIdleWorkers(boolean onlyOne) {
    // 步骤1：加锁保护 workers 集合遍历
    // 设计动因：workers 是 HashSet，非线程安全，遍历时需加锁防止并发修改
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        // 步骤2：遍历所有 Worker，尝试中断空闲线程
        for (Worker w : workers) {
            Thread t = w.thread;
            // 步骤2.1：双重检查 - 线程未被中断 且 tryLock 成功
            // - !t.isInterrupted()：避免重复中断已中断的线程
            // - w.tryLock()：CAS 尝试获取锁，state=0 时成功（空闲），state=1 时失败（执行中）
            if (!t.isInterrupted() && w.tryLock()) {
                try {
                    // 步骤2.2：中断空闲线程，唤醒阻塞在 getTask() 中的等待
                    t.interrupt();
                } catch (SecurityException ignore) {
                    // 步骤2.3：忽略安全异常，某些线程可能保持未中断
                } finally {
                    // 步骤2.4：释放 tryLock 获取的锁，恢复 state=0
                    w.unlock();
                }
            }
            // 步骤3：onlyOne=true 时只中断一个，用于传播式关闭
            // 调用场景：tryTerminate() 中，终止条件已满足但仍有其他 Worker
            // 设计意图：唤醒一个空闲线程检查池状态，它会退出并触发下一轮 tryTerminate，形成连锁反应
            if (onlyOne)
                break;
        }
    } finally {
        // 步骤4：释放 mainLock，确保锁一定被释放
        mainLock.unlock();
    }
}

线程销毁

线程销毁流程.png

processWorkerExit Worker 退出处理

/**
 * Performs cleanup and bookkeeping for a dying worker. Only
 * called from worker threads. Unless completedAbruptly is set,
 * assumes that workerCount has already been adjusted to account
 * for exit.  This method removes thread from worker set, and
 * possibly terminates the pool or replaces the worker if either
 * it exited due to user task exception, or fewer workers
 * are running than are required to handle the queue.
 *
 * <p>为即将退出的 Worker 执行清理和簿记工作。只能从 Worker 线程调用。
 * 除非 completedAbruptly 被设置，否则假设 workerCount 已经调整以计入退出。
 * 此方法从工作集中移除线程，并可能在以下情况下终止线程池或替换 Worker：
 * <ul>
 * <li>因用户任务异常退出</li>
 * <li>运行中的 Worker 数少于 corePoolSize</li>
 * <li>队列非空但没有 Worker</li>
 * </ul>
 *
 * @param w the worker
 * @param completedAbruptly if the worker died due to user exception
 */
private void processWorkerExit(Worker w, boolean completedAbruptly) {
        // 步骤1：调整 workerCount
        // 异常退出时 workerCount 还没调整，需要手动减一
        // 正常退出时 getTask() 已经调用了 decrementWorkerCount()
        if (completedAbruptly) // If abrupt, then workerCount wasn't adjusted
            decrementWorkerCount();
        
        // 步骤2：加锁移除 Worker，累加完成任务数
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            // 累加此 Worker 完成的任务数到线程池总数
            completedTaskCount += w.completedTasks;
            // 从工作集中移除
            workers.remove(w);
        } finally {
            mainLock.unlock();
        }
        
        // 步骤1和步骤2是为了退出的线程，步骤3和步骤4是为了整个线程池
        // ----------- 注意，这里是先终止再加线程 -----------

        // 步骤3：尝试终止线程池（条件检查，非强制）
        // 触发条件：(SHUTDOWN && 队列空) 或 (STOP)，且 workerCount == 0
        // 注：步骤3成功终止后状态变为 TERMINATED，步骤4的条件判断会直接跳过，两者激活条件互斥
        tryTerminate(); 

        // 步骤4：检查是否需要补充线程
        // 设计意图：先检查终止条件，再决定补充线程，避免在即将终止时创建多余线程
        int c = ctl.get();
        if (runStateLessThan(c, STOP)) { // RUNNING 或 SHUTDOWN 状态
            // 正常退出：检查是否需要补充线程
            // 异常退出：跳过检查，必须创建新线程替换（线程数可能不足）
            if (!completedAbruptly) {
                // 计算最小保有量：allowCoreThreadTimeOut=false 时为 corePoolSize，
                // 否则核心线程数可以归零（min=0）
                int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
                // 队列非空时至少保留 1 个线程处理-保证任务不被遗忘
                if (min == 0 && ! workQueue.isEmpty())
                    min = 1;
                // 当前线程数已够，无需补充
                if (workerCountOf(c) >= min)
                    return; // replacement not needed
            }
            // 补充线程：线程保有机制的最后一层兜底
            // addWorker(null, false) 尝试添加非核心线程，但若 wc < corePoolSize，
            // 该线程实际承担核心线程角色——线程池不区分"核心"与"非核心"线程类型。
            // 设计思想：损失一个尽量赔一个，让线程数尽量保持在 min 之上。
            // min 在 allowCoreThreadTimeOut=false 时等于 corePoolSize。
            addWorker(null, false);
        }
    }

常见问题与替代方案

调参的核心原则

线程池的调参有几个难点：

如果核心线程数过小，则吞吐可能不够，遇到流量毛刺可能导致 RejectExecutionException；但值得警惕的是，如果核心线程数很大，可能导致频繁的上下文切换和过多的资源消耗（不管是 cpu 时间片还是操作系统的内核线程）。
如果队列过长，导致请求数量增加时，大量任务堆积在队列中，任务执行时间过长，最终导致下游服务的大量调用超时失败。

那么，如何计算这些参数呢？
有一个基本的原则是：

计算密集型的线程数本身应该尽量贴近 cpu 核数。
io 密集型的线程数要注意伸缩，要配合阻塞队列使用，要有承受拒绝失败的的准备。

我们常见的计算方式主要来自于《Java Concurrency in Practice》§8.2（Sizing Thread Pools）：

线程池计算公式.png

方案一（出自《Java并发编程实践》）：

N_{cpu} = \text{number of CPUs}

U_{cpu} = \text{target CPU utilization},\ 0 \leq U_{cpu} \leq 1

\frac{W}{C} = \text{ratio of wait time to compute time}

The optimal pool size for keeping the processors at the desired utilization is:

N_{threads} = N_{cpu} \times U_{cpu} \times \left(1 + \frac{W}{C}\right)

问题：该方案偏理论化。首先，线程计算的时间和等待的时间要如何确定呢？这个在实际开发中很难得到确切的值。另外计算出来的线程个数逼近线程实体的个数，Java线程池可以利用线程切换的方式最大程度利用CPU核数，这样计算出来的结果是非常偏离业务场景的。

方案二：

coreSize = 2 \times N_{cpu}

maxSize = 25 \times N_{cpu}

问题：没有考虑应用中往往使用多个线程池的情况，统一的配置明显不符合多样的业务场景。

方案三：

coreSize = tps \times time

maxSize = tps \times time \times (1.7 \sim 2)

问题：这种计算方式，考虑到了业务场景，但是该模型是在假定流量平均分布得出的。业务场景的流量往往是随机的，这样不符合真实情况。

现实中可选的线程数计算公式最好是取一个并发 qps 数和 cpu 数的折中。通常可以认为 1000ms / 单任务RT(ms) 可以得到单一线程的吞吐数，目标QPS / 单线程吞吐数 可以得到相应的线程数。但这个方案没有考虑 cpu 核数和上下文切换的问题，所以这样算出来的线程数的实际 qps 表现应该低于理论 qps，但可以通过估算和压测不断让理论值逼近实际值。

替代方案对比

其他可替代方案，都不如线程池的调优方案成熟（在可以使用新技术的前提下，我们是否还有调优旧方案的魄力呢？）：

传统替代方案对比

名称	描述	优势	劣势
Disruptor框架	线程池内部是通过一个工作队列去维护任务的执行的，它有一个根本性的缺陷：连续争用问题。也就是多个线程在申请任务时，为了合理地分配任务要付出锁资源，对比快速的任务执行来说，这部分申请的损耗是巨大的。高性能进程间消息库LMAX使用了一个叫作环形缓冲的数据结构，用这种这个特殊的数据结构替代队列，将会避免申请任务时出现的连续争用状况。	避免连续争用，性能更佳	缺乏线程管理的能力，使用场景较少
协程框架	协程是一种用户态的轻量级线程，其拥有自己的寄存器上下文和栈，当调度切换时，将寄存器上下文和栈保存到其他地方，在切回来的时候，恢复先前保存的寄存器上下文和栈。这种切换上下文的方式要小于线程的开销。在瓶颈侧重IO的情况，使用协程获得并发性要优于使用线程。	侧重IO情况时，性能更佳。与多线程策略无冲突，可结合使用	在Java中缺乏成熟的应用
Actor框架	Actor模型通过维护多个Actor去处理并发的任务，它放弃了直接使用线程去获取并发性，而是自己定义了一系列系统组件应该如何动作和交互的通用规则，不需要开发者直接使用线程。通过在原生的线程或协程的级别上做了更高层次的封装，只需要开发者关心每个Actor的逻辑即可实现并发操作。由于避免了直接使用锁，很大程度解决了传统并发编程模式下大量依赖悲观锁导致的资源竞争情况。	无锁策略，性能更佳，避免直接使用线程，安全性更高	在Java中缺乏成熟的应用，内部复杂，难以排查和调试

现代Java并发框架对比

根据Java并发编程实践和各框架的Javadoc文档，以下是主流并发框架的详细对比：

框架	适用场景	核心优势	主要劣势	典型应用	成熟度
ThreadPoolExecutor	通用任务调度、CPU/IO混合负载	JDK内置、灵活配置、监控完善、社区成熟	配置复杂、需要调优经验	Web服务、批处理、定时任务	⭐⭐⭐⭐⭐
ForkJoinPool	CPU密集型分治任务、并行计算	工作窃取算法、自动负载均衡、递归任务优化	不适合阻塞操作、调试困难	Stream.parallel()、大数据计算	⭐⭐⭐⭐
ScheduledThreadPoolExecutor	定时/周期任务调度	精确调度、多任务并发、内存高效	不支持cron表达式、时区处理弱	心跳检测、数据同步	⭐⭐⭐⭐⭐
Project Reactor	响应式异步流处理、高并发服务	背压支持、组合能力强、非阻塞IO	学习曲线陡峭、调试复杂	WebFlux、消息驱动架构	⭐⭐⭐⭐
RxJava	异步事件流、UI编程	丰富的操作符、链式调用、易于组合	内存开销大、线程切换频繁	Android开发、事件驱动系统	⭐⭐⭐⭐
Kotlin Coroutines	轻量级协程、异步IO密集型	资源占用少、代码简洁、结构化并发	需要Kotlin环境、JVM协程非原生	Kotlin服务端、Android	⭐⭐⭐⭐
Virtual Threads (JDK 21+)	高并发IO密集型、阻塞API场景	轻量级、无需线程池、阻塞代码简化	新特性、生态不成熟、CPU密集型无优势	高并发Web服务、数据库连接	⭐⭐⭐
Akka	分布式Actor系统、高并发消息处理	无锁设计、容错性强、分布式原生	复杂度高、学习成本大、调试困难	实时系统、游戏服务器	⭐⭐⭐⭐

选择建议

选择ThreadPoolExecutor的场景：

通用的异步任务处理
需要精确控制线程数和队列大小
要求完善的监控和调优能力
团队熟悉传统并发模型

选择响应式框架（Reactor/RxJava）的场景：

微服务架构，需要高并发非阻塞IO
数据流处理，需要背压和流量控制
复杂的异步组合逻辑
已有Spring WebFlux等响应式基础设施

选择Virtual Threads的场景：

JDK 21+环境
大量阻塞IO操作（数据库、HTTP调用）
希望简化异步代码（避免回调地狱）
不需要精细的线程池调优

选择ForkJoinPool的场景：

CPU密集型递归算法
并行数据处理（如Stream.parallel()）
需要工作窃取优化的场景

关键原则：

不要为了新而新：ThreadPoolExecutor 是传统同步阻塞模型下的首选，具备最精细的资源管控能力。只有明确的技术驱动因素才值得切换到其他方案。
混合使用：可以在同一系统中混合使用不同框架（如ThreadPoolExecutor处理计算，Reactor处理IO）
渐进式迁移：从ThreadPoolExecutor迁移到新框架需要充分测试和评估

缺乏管控能力就不适合调优。

ThreadPoolExecutor 监控与调优实践

监控指标采集

根据Java并发编程最佳实践和 ThreadPoolExecutor 的Javadoc，以下是关键的监控指标：

import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicLong;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

/**
 * 线程池监控指标采集示例
 * 
 * @author magicliang
 * @since 2026-01-24
 */
public class ThreadPoolMonitor {
    private static final Logger logger = LoggerFactory.getLogger(ThreadPoolMonitor.class);
    
    private final ThreadPoolExecutor executor;
    private final ScheduledExecutorService scheduler;
    private final AtomicLong rejectedCount = new AtomicLong(0);
    
    public ThreadPoolMonitor(ThreadPoolExecutor executor) {
        this.executor = executor;
        this.scheduler = Executors.newSingleThreadScheduledExecutor(r -> {
            Thread t = new Thread(r, "pool-monitor");
            t.setDaemon(true);
            return t;
        });
        
        // 包装拒绝策略以统计拒绝次数
        wrapRejectedExecutionHandler();
    }
    
    /**
     * 启动监控，每60秒采集一次指标
     */
    public void startMonitoring() {
        scheduler.scheduleAtFixedRate(() -> {
            try {
                logMetrics();
            } catch (Throwable t) {
                logger.error("Failed to log thread pool metrics", t);
            }
        }, 0, 60, TimeUnit.SECONDS);
    }
    
    /**
     * 采集并记录线程池指标
     */
    private void logMetrics() {
        int activeCount = executor.getActiveCount();
        int poolSize = executor.getPoolSize();
        int corePoolSize = executor.getCorePoolSize();
        int maximumPoolSize = executor.getMaximumPoolSize();
        long completedTaskCount = executor.getCompletedTaskCount();
        long taskCount = executor.getTaskCount();
        int queueSize = executor.getQueue().size();
        int queueRemainingCapacity = executor.getQueue().remainingCapacity();
        
        // 计算活跃度
        double activeRatio = maximumPoolSize > 0 ? 
            (double) activeCount / maximumPoolSize : 0;
        
        // 计算队列使用率
        int queueCapacity = queueSize + queueRemainingCapacity;
        double queueUsageRatio = queueCapacity > 0 ? 
            (double) queueSize / queueCapacity : 0;
        
        // 记录指标
        logger.info("ThreadPool Metrics: " +
            "activeCount={}, " +
            "poolSize={}/{}, " +
            "activeRatio={}, " +
            "queueSize={}/{}, " +
            "queueUsageRatio={}, " +
            "completedTasks={}, " +
            "totalTasks={}, " +
            "rejectedCount={}",
            activeCount,
            poolSize, maximumPoolSize,
            String.format("%.2f", activeRatio),
            queueSize, queueCapacity,
            String.format("%.2f", queueUsageRatio),
            completedTaskCount,
            taskCount,
            rejectedCount.get());
        
        // 告警检查
        checkAndAlert(activeRatio, queueUsageRatio);
    }
    
    /**
     * 检查指标并触发告警
     */
    private void checkAndAlert(double activeRatio, double queueUsageRatio) {
        // 活跃度超过90%告警
        if (activeRatio > 0.9) {
            logger.warn("Thread pool active ratio too high: {}", activeRatio);
        }
        
        // 队列使用率超过80%告警
        if (queueUsageRatio > 0.8) {
            logger.warn("Thread pool queue usage too high: {}", queueUsageRatio);
        }
        
        // 拒绝次数超过阈值告警
        long rejected = rejectedCount.get();
        if (rejected > 100) {
            logger.error("Thread pool rejected too many tasks: {}", rejected);
        }
    }
    
    /**
     * 包装拒绝策略以统计拒绝次数
     */
    private void wrapRejectedExecutionHandler() {
        RejectedExecutionHandler originalHandler = executor.getRejectedExecutionHandler();
        executor.setRejectedExecutionHandler((r, executor) -> {
            rejectedCount.incrementAndGet();
            originalHandler.rejectedExecution(r, executor);
        });
    }
    
    /**
     * 停止监控
     */
    public void stopMonitoring() {
        scheduler.shutdown();
        try {
            scheduler.awaitTermination(5, TimeUnit.SECONDS);
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        }
    }
}

调优建议

1. 核心线程数设置：

1 2	`CPU密集型：核心线程数 = CPU核数 + 1 IO密集型：核心线程数 = CPU核数 * (1 + 平均等待时间/平均计算时间)`

2. 队列大小设置：

快速失败场景：小队列 + AbortPolicy
削峰填谷场景：中等队列 + CallerRunsPolicy
避免丢失场景：大队列（但要监控）

3. 拒绝策略选择：

策略	适用场景	风险
AbortPolicy	快速失败，允许丢任务	任务丢失
CallerRunsPolicy	降级执行，不丢任务	调用线程阻塞
DiscardPolicy	静默丢弃	无感知丢失
DiscardOldestPolicy	丢弃最老任务	优先级倒置

如果还是解决不了问题，需要考虑全局动态扩容的方案。

线程池监控指标体系：

graph TB
    subgraph 核心监控指标
        A[线程池监控] --> B[线程指标]
        A --> C[队列指标]
        A --> D[任务指标]
        A --> E[异常指标]
        
        B --> B1[poolSize<br/>当前线程数]
        B --> B2[activeCount<br/>活跃线程数]
        B --> B3[largestPoolSize<br/>历史最大线程数]
        B --> B4[corePoolSize<br/>核心线程数]
        B --> B5[maximumPoolSize<br/>最大线程数]
        
        C --> C1[queue.size<br/>队列当前大小]
        C --> C2[queue.remainingCapacity<br/>队列剩余容量]
        C --> C3[队列使用率<br/>size/capacity]
        
        D --> D1[taskCount<br/>总任务数]
        D --> D2[completedTaskCount<br/>已完成任务数]
        D --> D3[待执行任务数<br/>taskCount-completedTaskCount]
        
        E --> E1[rejectedCount<br/>拒绝任务数]
        E --> E2[exceptionCount<br/>异常任务数]
    end
    
    style A fill:#4ECDC4
    style B fill:#87CEEB
    style C fill:#90EE90
    style D fill:#FFB6C1
    style E fill:#FF6B6B

完整的线程池监控实现：

import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicLong;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;

/**
 * 可监控的线程池实现
 * 提供完整的监控指标收集和告警能力
 */
public class MonitoredThreadPoolExecutor extends ThreadPoolExecutor {
    
    // ==================== 监控指标 ====================
    
    /** 拒绝任务计数器 */
    private final AtomicLong rejectedCount = new AtomicLong(0);
    
    /** 异常任务计数器 */
    private final AtomicLong exceptionCount = new AtomicLong(0);
    
    /** 任务执行时间统计（纳秒） */
    private final AtomicLong totalExecutionTime = new AtomicLong(0);
    
    /** 任务开始时间记录（用于计算执行时间） */
    private final Map<Runnable, Long> taskStartTimes = new ConcurrentHashMap<>();
    
    /** 线程池名称（用于日志和监控标识） */
    private final String poolName;
    
    /** 告警阈值配置 */
    private volatile double activeRatioThreshold = 0.8;      // 活跃度告警阈值
    private volatile double queueUsageThreshold = 0.8;       // 队列使用率告警阈值
    private volatile long taskTimeoutMs = 30000;             // 任务超时阈值（毫秒）
    
    // ==================== 构造函数 ====================
    
    public MonitoredThreadPoolExecutor(
            String poolName,
            int corePoolSize,
            int maximumPoolSize,
            long keepAliveTime,
            TimeUnit unit,
            BlockingQueue<Runnable> workQueue,
            ThreadFactory threadFactory) {
        
        super(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue, threadFactory,
            // 使用自定义拒绝策略来统计拒绝次数
            (r, executor) -> {
                ((MonitoredThreadPoolExecutor) executor).rejectedCount.incrementAndGet();
                // 记录拒绝日志
                System.err.printf("[%s] 任务被拒绝: queue=%d, active=%d, pool=%d%n",
                    ((MonitoredThreadPoolExecutor) executor).poolName,
                    executor.getQueue().size(),
                    executor.getActiveCount(),
                    executor.getPoolSize());
                // 默认行为：抛出异常
                throw new RejectedExecutionException("Task rejected from " + 
                    ((MonitoredThreadPoolExecutor) executor).poolName);
            });
        
        this.poolName = poolName;
    }
    
    // ==================== 生命周期钩子 ====================
    
    @Override
    protected void beforeExecute(Thread t, Runnable r) {
        super.beforeExecute(t, r);
        // 记录任务开始时间
        taskStartTimes.put(r, System.nanoTime());
    }
    
    @Override
    protected void afterExecute(Runnable r, Throwable t) {
        try {
            // 计算任务执行时间
            Long startTime = taskStartTimes.remove(r);
            if (startTime != null) {
                long executionTime = System.nanoTime() - startTime;
                totalExecutionTime.addAndGet(executionTime);
                
                // 检查任务是否超时
                long executionTimeMs = TimeUnit.NANOSECONDS.toMillis(executionTime);
                if (executionTimeMs > taskTimeoutMs) {
                    System.err.printf("[%s] 任务执行超时: %dms > %dms%n",
                        poolName, executionTimeMs, taskTimeoutMs);
                }
            }
            
            // 统计异常
            if (t != null) {
                exceptionCount.incrementAndGet();
                System.err.printf("[%s] 任务执行异常: %s%n", poolName, t.getMessage());
            }
        } finally {
            super.afterExecute(r, t);
        }
    }
    
    // ==================== 监控指标获取 ====================
    
    /**
     * 获取线程池活跃度（0.0 ~ 1.0）
     * 活跃度 = 活跃线程数 / 最大线程数
     */
    public double getActiveRatio() {
        return (double) getActiveCount() / getMaximumPoolSize();
    }
    
    /**
     * 获取队列使用率（0.0 ~ 1.0）
     * 使用率 = 队列当前大小 / 队列总容量
     */
    public double getQueueUsageRatio() {
        BlockingQueue<Runnable> queue = getQueue();
        int size = queue.size();
        int capacity = size + queue.remainingCapacity();
        return capacity > 0 ? (double) size / capacity : 0.0;
    }
    
    /**
     * 获取平均任务执行时间（毫秒）
     */
    public double getAverageExecutionTimeMs() {
        long completed = getCompletedTaskCount();
        if (completed == 0) return 0.0;
        return TimeUnit.NANOSECONDS.toMillis(totalExecutionTime.get()) / (double) completed;
    }
    
    /**
     * 获取拒绝任务数
     */
    public long getRejectedCount() {
        return rejectedCount.get();
    }
    
    /**
     * 获取异常任务数
     */
    public long getExceptionCount() {
        return exceptionCount.get();
    }
    
    /**
     * 获取待执行任务数
     */
    public long getPendingTaskCount() {
        return getTaskCount() - getCompletedTaskCount();
    }
    
    /**
     * 获取完整的监控快照
     */
    public ThreadPoolMetrics getMetrics() {
        return new ThreadPoolMetrics(
            poolName,
            getCorePoolSize(),
            getMaximumPoolSize(),
            getPoolSize(),
            getActiveCount(),
            getLargestPoolSize(),
            getTaskCount(),
            getCompletedTaskCount(),
            getQueue().size(),
            getQueue().remainingCapacity(),
            rejectedCount.get(),
            exceptionCount.get(),
            getAverageExecutionTimeMs()
        );
    }
    
    // ==================== 告警检查 ====================
    
    /**
     * 检查是否需要告警
     */
    public void checkAndAlert() {
        // 检查活跃度
        double activeRatio = getActiveRatio();
        if (activeRatio >= activeRatioThreshold) {
            System.err.printf("[%s] 告警: 线程池活跃度过高 %.2f%% >= %.2f%%%n",
                poolName, activeRatio * 100, activeRatioThreshold * 100);
        }
        
        // 检查队列使用率
        double queueUsage = getQueueUsageRatio();
        if (queueUsage >= queueUsageThreshold) {
            System.err.printf("[%s] 告警: 队列使用率过高 %.2f%% >= %.2f%%%n",
                poolName, queueUsage * 100, queueUsageThreshold * 100);
        }
        
        // 检查拒绝任务
        if (rejectedCount.get() > 0) {
            System.err.printf("[%s] 告警: 存在被拒绝的任务 count=%d%n",
                poolName, rejectedCount.get());
        }
    }
    
    // ==================== 动态调参 ====================
    
    /**
     * 动态调整核心线程数
     */
    public void adjustCorePoolSize(int newCorePoolSize) {
        int oldSize = getCorePoolSize();
        setCorePoolSize(newCorePoolSize);
        System.out.printf("[%s] 核心线程数调整: %d -> %d%n", poolName, oldSize, newCorePoolSize);
    }
    
    /**
     * 动态调整最大线程数
     */
    public void adjustMaximumPoolSize(int newMaximumPoolSize) {
        int oldSize = getMaximumPoolSize();
        setMaximumPoolSize(newMaximumPoolSize);
        System.out.printf("[%s] 最大线程数调整: %d -> %d%n", poolName, oldSize, newMaximumPoolSize);
    }
    
    // ==================== 监控指标数据类 ====================
    
    public static class ThreadPoolMetrics {
        public final String poolName;
        public final int corePoolSize;
        public final int maximumPoolSize;
        public final int poolSize;
        public final int activeCount;
        public final int largestPoolSize;
        public final long taskCount;
        public final long completedTaskCount;
        public final int queueSize;
        public final int queueRemainingCapacity;
        public final long rejectedCount;
        public final long exceptionCount;
        public final double avgExecutionTimeMs;
        
        public ThreadPoolMetrics(String poolName, int corePoolSize, int maximumPoolSize,
                int poolSize, int activeCount, int largestPoolSize, long taskCount,
                long completedTaskCount, int queueSize, int queueRemainingCapacity,
                long rejectedCount, long exceptionCount, double avgExecutionTimeMs) {
            this.poolName = poolName;
            this.corePoolSize = corePoolSize;
            this.maximumPoolSize = maximumPoolSize;
            this.poolSize = poolSize;
            this.activeCount = activeCount;
            this.largestPoolSize = largestPoolSize;
            this.taskCount = taskCount;
            this.completedTaskCount = completedTaskCount;
            this.queueSize = queueSize;
            this.queueRemainingCapacity = queueRemainingCapacity;
            this.rejectedCount = rejectedCount;
            this.exceptionCount = exceptionCount;
            this.avgExecutionTimeMs = avgExecutionTimeMs;
        }
        
        @Override
        public String toString() {
            return String.format(
                "ThreadPoolMetrics{pool=%s, core=%d, max=%d, current=%d, active=%d, " +
                "largest=%d, tasks=%d, completed=%d, queue=%d/%d, rejected=%d, " +
                "exceptions=%d, avgTime=%.2fms}",
                poolName, corePoolSize, maximumPoolSize, poolSize, activeCount,
                largestPoolSize, taskCount, completedTaskCount, queueSize,
                queueSize + queueRemainingCapacity, rejectedCount, exceptionCount,
                avgExecutionTimeMs);
        }
    }
}

定时监控任务示例：

import java.util.concurrent.*;

public class ThreadPoolMonitorExample {
    
    public static void main(String[] args) throws InterruptedException {
        // 创建可监控的线程池
        MonitoredThreadPoolExecutor executor = new MonitoredThreadPoolExecutor(
            "business-pool",
            4,                              // corePoolSize
            8,                              // maximumPoolSize
            60L, TimeUnit.SECONDS,          // keepAliveTime
            new LinkedBlockingQueue<>(100), // workQueue
            r -> {
                Thread t = new Thread(r);
                t.setName("business-pool-" + t.getId());
                return t;
            }
        );
        
        // 启动监控任务（每5秒打印一次指标）
        ScheduledExecutorService monitor = Executors.newSingleThreadScheduledExecutor();
        monitor.scheduleAtFixedRate(() -> {
            // 获取并打印监控指标
            MonitoredThreadPoolExecutor.ThreadPoolMetrics metrics = executor.getMetrics();
            System.out.println(metrics);
            
            // 检查告警
            executor.checkAndAlert();
            
            // 可以在这里将指标上报到监控系统
            // metricsReporter.report(metrics);
            
        }, 0, 5, TimeUnit.SECONDS);
        
        // 模拟提交任务
        for (int i = 0; i < 50; i++) {
            final int taskId = i;
            try {
                executor.execute(() -> {
                    try {
                        // 模拟任务执行
                        Thread.sleep((long) (Math.random() * 1000));
                        System.out.println("任务" + taskId + "完成");
                    } catch (InterruptedException e) {
                        Thread.currentThread().interrupt();
                    }
                });
            } catch (RejectedExecutionException e) {
                System.err.println("任务" + taskId + "被拒绝");
            }
            Thread.sleep(100);
        }
        
        // 等待任务完成
        Thread.sleep(10000);
        
        // 关闭
        executor.shutdown();
        monitor.shutdown();
    }
}

监控告警决策流程：

flowchart TD
    A[定时采集指标] --> B{活跃度 >= 80%?}
    B -->|是| C[告警: 线程池繁忙]
    B -->|否| D{队列使用率 >= 80%?}
    
    D -->|是| E[告警: 队列积压]
    D -->|否| F{有拒绝任务?}
    
    F -->|是| G[告警: 任务被拒绝]
    F -->|否| H{平均执行时间过长?}
    
    H -->|是| I[告警: 任务执行慢]
    H -->|否| J[正常]
    
    C --> K{是否自动扩容?}
    E --> K
    G --> K
    
    K -->|是| L[动态调整参数]
    K -->|否| M[通知运维处理]
    
    L --> N{调整core?}
    N -->|是| O[setCorePoolSize]
    N -->|否| P{调整max?}
    P -->|是| Q[setMaximumPoolSize]
    P -->|否| R[调整队列容量]
    
    style C fill:#FF6B6B
    style E fill:#FF6B6B
    style G fill:#FF6B6B
    style I fill:#FFB6C1
    style J fill:#90EE90
    style L fill:#4ECDC4

Spring Boot 集成监控示例：

import org.springframework.boot.actuate.endpoint.annotation.*;
import org.springframework.stereotype.Component;
import java.util.Map;
import java.util.HashMap;

/**
 * 线程池监控端点
 * 访问 /actuator/threadpool 获取所有线程池状态
 */
@Component
@Endpoint(id = "threadpool")
public class ThreadPoolEndpoint {
    
    private final Map<String, MonitoredThreadPoolExecutor> executors = new HashMap<>();
    
    public void register(String name, MonitoredThreadPoolExecutor executor) {
        executors.put(name, executor);
    }
    
    @ReadOperation
    public Map<String, Object> health() {
        Map<String, Object> result = new HashMap<>();
        
        for (Map.Entry<String, MonitoredThreadPoolExecutor> entry : executors.entrySet()) {
            MonitoredThreadPoolExecutor executor = entry.getValue();
            Map<String, Object> poolInfo = new HashMap<>();
            
            // 基础指标
            poolInfo.put("corePoolSize", executor.getCorePoolSize());
            poolInfo.put("maximumPoolSize", executor.getMaximumPoolSize());
            poolInfo.put("poolSize", executor.getPoolSize());
            poolInfo.put("activeCount", executor.getActiveCount());
            poolInfo.put("largestPoolSize", executor.getLargestPoolSize());
            
            // 任务指标
            poolInfo.put("taskCount", executor.getTaskCount());
            poolInfo.put("completedTaskCount", executor.getCompletedTaskCount());
            poolInfo.put("pendingTaskCount", executor.getPendingTaskCount());
            
            // 队列指标
            poolInfo.put("queueSize", executor.getQueue().size());
            poolInfo.put("queueRemainingCapacity", executor.getQueue().remainingCapacity());
            
            // 计算指标
            poolInfo.put("activeRatio", String.format("%.2f%%", executor.getActiveRatio() * 100));
            poolInfo.put("queueUsageRatio", String.format("%.2f%%", executor.getQueueUsageRatio() * 100));
            poolInfo.put("avgExecutionTimeMs", String.format("%.2f", executor.getAverageExecutionTimeMs()));
            
            // 异常指标
            poolInfo.put("rejectedCount", executor.getRejectedCount());
            poolInfo.put("exceptionCount", executor.getExceptionCount());
            
            result.put(entry.getKey(), poolInfo);
        }
        
        return result;
    }
    
    @WriteOperation
    public String adjustPoolSize(
            @Selector String poolName,
            @Nullable Integer corePoolSize,
            @Nullable Integer maximumPoolSize) {
        
        MonitoredThreadPoolExecutor executor = executors.get(poolName);
        if (executor == null) {
            return "线程池不存在: " + poolName;
        }
        
        if (corePoolSize != null) {
            executor.adjustCorePoolSize(corePoolSize);
        }
        if (maximumPoolSize != null) {
            executor.adjustMaximumPoolSize(maximumPoolSize);
        }
        
        return "调整成功";
    }
}

这里的 activeCount 是每个 worker 是否互斥 held 的总数的统计：

   public int getActiveCount() {
        // workers 是一个 HashSet，它是非线程安全的。
getActiveCount 需要遍历这个集合，如果不加全局的 mainLock，在遍历过程中如果有线程销毁或创建，会抛出 ConcurrentModificationException 或者读到错误的数据。所以 mainLock 是为了保护 workers 集合的遍历安全。
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            int n = 0;
            for (Worker w : workers)
                // 在 ThreadPoolExecutor 的设计中，Worker 只要开始执行任务（runWorker 方法中），就会把自己锁住（lock）。
                // 当 Worker 没有任务做，正在 getTask() 方法里阻塞等待（即空闲状态）时，它是**不加锁（unlocked）**的。
                // 所以，isLocked() == true 等价于 “这个线程正在干活”。
                // getActiveCount 的目的就是统计“当前有多少个线程正在干活”，所以必须统计被锁住的 Worker。
                if (w.isLocked())
                    ++n;
            return n;
        } finally {
            mainLock.unlock();
        }
    }

这里的 isLocked 意味着这个工作线程正在跑 task 的 run，意味着可能是如下状态：RUNNABLE、BLOCKED、WAITING、TIMED_WAITING。

最终解决方案

通过监控线程池负载，制定告警策略：

线程池活跃度 = activeCount/maximumPoolSize。看看这个值是不是趋近于 1。
监控队列的capacity 和 size 的比例。
监控 RejectExecutionException 的出现。

加引入线程池动态管控能力，基于告警制定 sop，确定是否要动态调节线程数和拒绝策略。

ScheduledThreadPoolExecutor 详解

在第1章中，我们了解了 ScheduledExecutorService 接口的基本用法和常见陷阱。本章将深入其核心实现 ScheduledThreadPoolExecutor，探讨其内部机制和设计原理。

延迟队列任务的标准实现模式

延迟队列任务通常包含一个代表 deadline 的时间字段，需要实现 Delayed 接口：

// Delayed 接口继承 Comparable，因为延迟队列需要按时间排序取出最早到期的任务
// 二叉堆的入队/出队操作依赖 compareTo 确定任务优先级
public interface Delayed extends Comparable<Delayed> {
    long getDelay(TimeUnit unit);
}

ScheduledFutureTask 的实现：

class ScheduledFutureTask<V> extends FutureTask<V> implements RunnableScheduledFuture<V> {
    // 纳秒级的时间戳，表示任务的 deadline（标准延迟队列设计模式）
    private volatile long time;
    
    // 周期任务的周期值
    // 正数：fixed-rate模式，表示理论时间间隔
    // 负数：fixed-delay模式，表示实际延迟时间  
    // 零：一次性任务
    private final long period;
    
    // 序列号，用于相同时间任务的排序（FIFO 保证）
    private final long sequenceNumber;

    public long getDelay(TimeUnit unit) {
        return unit.convert(time - now(), NANOSECONDS);
    }

    public int compareTo(Delayed other) {
        if (other == this) return 0;
        if (other instanceof ScheduledFutureTask) {
            ScheduledFutureTask<?> x = (ScheduledFutureTask<?>)other;
            long diff = time - x.time;
            if (diff < 0) return -1;
            else if (diff > 0) return 1;
            else if (sequenceNumber < x.sequenceNumber) return -1;
            else return 1;
        }
        long diff = getDelay(NANOSECONDS) - other.getDelay(NANOSECONDS);
        return (diff < 0) ? -1 : (diff > 0) ? 1 : 0;
    }
    
    // Override FutureTask.run()，根据任务类型分流执行逻辑
    public void run() {
        boolean periodic = isPeriodic();  // period != 0 为周期任务
        
        // 状态检查：线程池关闭时是否继续执行？周期任务和一次性任务策略不同
        // STPE.shutdown() 后一次性任务仍可执行，周期任务需停止（除非配置了 continueExistingPeriodicTasksAfterShutdown）
        if (!canRunInCurrentRunState(periodic)) {
            cancel(false);  // 不中断正在执行的任务，仅标记取消
            return;
        }
        
        if (!periodic) {
            // 一次性任务：调用 FutureTask.run()
            // 正常完成 -> state = NORMAL，callable 被清空
            // 异常完成 -> state = EXCEPTIONAL，异常被记录
            super.run();
        } else {
            // 周期任务：调用 FutureTask.runAndReset()
            // 正常完成 -> state 保持 NEW，callable 保留，可重复执行
            // 异常/取消 -> 进入终态，后续不再调度
            if (super.runAndReset()) {
                setNextRunTime();           // 根据 period 正负计算下次时间，详见 setNextRunTime() 完整源码
                reExecutePeriodic(outerTask); // STPE 方法：入队 + ensurePrestart()
            }
            // 若 runAndReset() 返回 false，任务不再重新入队，调度终止
            // 原因：执行异常、被取消、或 CAS 绑定 runner 失败
        }
    }
}

**run() 方法中的调用归属**：
| 方法 | 归属 | 说明 |
|------|------|------|
| `isPeriodic()` | ScheduledFutureTask | 检查 `period != 0` |
| `canRunInCurrentRunState(periodic)` | STPE | 检查线程池状态 + 关闭策略配置 |
| `cancel(false)` | FutureTask | 继承自父类 |
| `super.run()` | FutureTask | 父类方法，执行后进入终态 |
| `super.runAndReset()` | FutureTask | 父类方法，执行后状态保持 NEW |
| `setNextRunTime()` | ScheduledFutureTask | 私有方法，更新 time 字段 |
| `reExecutePeriodic(task)` | STPE | 入队 + ensurePrestart() |

**为什么 setNextRunTime 和 reExecutePeriodic 分离？**

职责分离：
- `setNextRunTime()` 只修改 `time` 字段，是任务内部状态计算
- `reExecutePeriodic()` 涉及线程池调度：入队、检查线程池状态、启动工作线程

如果合并，任务类就需要持有外线程池引用来调用 `ensurePrestart()`，破坏封装。分离后，任务只负责时间计算，入队和线程管理交给 STPE。

**为什么用 outerTask 而不是 this？**

`outerTask` 初始值是 `this`，但可被 `decorateTask()` 替换：

```java
// scheduleAtFixedRate 中的关键代码
RunnableScheduledFuture<V> t = decorateTask(r, 
    new ScheduledFutureTask<V>(r, result, time, period));
// decorateTask 可返回包装后的任务（如添加日志、追踪的装饰器）
// outerTask 指向 decorateTask 返回的对象，而非原始的 this

子类重写 decorateTask() 返回装饰器包装的任务时，outerTask 指向包装后的版本。重新入队时用 outerTask 可保持装饰器链完整，不丢失包装层。


**关键设计点**：
- **统一时间表示**：所有任务都用纳秒级时间戳表示deadline
- **周期任务复用**：通过runAndReset()避免创建新对象，提高内存效率
- **追赶机制**：fixed-rate模式下，如果执行时间超过period，会在任务完成后立即执行下一次（不会并发），以追赶理论时间轴
- **序列号排序**：相同deadline的任务通过sequenceNumber保证FIFO顺序

## DelayedWorkQueue 的数据结构选择

虽然 `DelayQueue` 也实现了 `BlockingQueue` 接口和 leader-follower 模式，但 `ScheduledThreadPoolExecutor` 选择使用内部类 `DelayedWorkQueue`，原因是：

1. `DelayedWorkQueue` 可直接访问 `ScheduledFutureTask` 的内部字段（`time`、`sequenceNumber`），无需通过 `Delayed` 接口方法
2. 提供了专属优化方法（如 `setNextRunTime`、`reInsert`），支持周期任务的高效重入队
3. 避免了额外的对象封装开销

DelayedWorkQueue 使用**二叉堆（最小堆）** 来实现延迟队列，而不是使用跳表或其他数据结构。

**为什么选择二叉堆？**

1. **时间复杂度优势**：
   - 入队（offer）：O(log n)
   - 出队（take）：O(log n)
   - 查看队首（peek）：O(1)

2. **内存效率**：基于数组实现，无需额外的指针开销

3. **适合单线程访问**：DelayedWorkQueue 内部使用 ReentrantLock 保护，保证单线程访问，无需考虑并发访问的数据结构选择

**二叉堆 vs Redis ZSET（跳表）的对比**：

| 特性 | 二叉堆（Java DelayedWorkQueue） | 跳表（Redis ZSET） |
|------|--------------------------------|-------------------|
| **数据结构** | 数组实现的完全二叉树 | 多层链表 + 跳跃指针 |
| **时间复杂度** | 插入/删除 O(log n)，查找最小 O(1) | 插入/删除/查找 O(log n) |
| **范围查询** | 不支持（需 O(n log n) 排序） | 支持（O(log n) 定位 + O(k) 遍历） |
| **内存开销** | 低（数组连续存储） | 较高（多层链表指针） |
| **并发模型** | 单线程 + 锁保护 | 单线程事件循环 |
| **适用场景** | 单机延迟队列，只需获取最早任务 | 分布式排序集合，需要范围查询 |

**为什么 Redis ZSET 不使用二叉堆？**

1. **范围查询需求**：Redis ZSET 需要支持 `ZRANGE`、`ZRANGEBYSCORE` 等范围查询操作，二叉堆无法高效支持（需要 O(n) 时间），而跳表天然支持 O(log n) 的范围查询

2. **有序遍历**：Redis 需要按分数顺序遍历元素，跳表的中序遍历即可实现且保持数据完整，而二叉堆通过弹出堆顶排序会破坏堆结构，遍历后需重建

**为什么 Java DelayedWorkQueue 选择二叉堆而非跳表？**

核心原因是**操作模式匹配**：

| 操作 | ScheduledThreadPoolExecutor | Redis ZSET |
|------|---------------------------|------------|
| 入队 | 单个任务入队 | 单个元素入队 |
| 出队 | 取出最早到期的一个任务 | 取出范围/按分数查询 |
| 典型查询 | "有没有任务到期了？" | "取出分数 100-200 的所有元素" |

二叉堆的 O(1) 查看堆顶精确匹配 Java 的场景：每次只需知道最早一个任务是否到期。跳表的范围查询能力在此场景无用武之地。

内存开销是次要因素：跳表的多层指针确实增加内存，但如果场景需要范围查询，Java 也不会因内存而放弃跳表。关键在于 Java 的延迟队列**根本不需要**范围查询。

**总结**：
- **Java DelayedWorkQueue**：单机场景，只需获取最早任务，二叉堆是最佳选择（O(1) 查找最小值）
- **Redis ZSET**：分布式场景，需要范围查询和有序遍历，跳表是最佳选择（O(log n) 范围查询）

## 任务调度的完整流程

```mermaid
sequenceDiagram
    participant Client as 客户端代码
    participant Service as ScheduledThreadPoolExecutor
    participant Queue as DelayedWorkQueue
    participant Task as ScheduledFutureTask
    participant Worker as Worker线程
    
    Client->>Service: scheduleAtFixedRate(task, 0, 1, SECONDS)
    Service->>Task: 创建ScheduledFutureTask实例
    Service->>Queue: offer(task)入队
    Queue->>Queue: 堆调整，维护时间顺序
    
    loop 任务执行循环
        Worker->>Queue: take()获取到期任务
        Queue-->>Worker: 返回到期的ScheduledFutureTask
        Worker->>Task: 执行run()方法
        
        alt 周期任务
            Worker->>Task: runAndReset()执行并重置
            Task->>Task: setNextRunTime()计算下次时间
            Task->>Queue: reExecutePeriodic()重新入队
            Queue->>Queue: 堆调整
        else 一次性任务
            Worker->>Task: run()正常执行完成
            Task->>Task: 设置完成状态
        end
    end

内存管理和性能优化

对象复用机制：

周期任务复用同一个ScheduledFutureTask对象
避免频繁的对象创建和垃圾回收开销
通过runAndReset()方法重置任务状态而非创建新实例

时间精度处理：

内部使用System.nanoTime()而非System.currentTimeMillis()
避免系统时钟调整对调度精度的影响
纳秒级精度确保高频调度的准确性

队列优化 - Leader-Follower 模式：

基于堆的优先队列实现 O(log n) 的插入和删除
Leader-Follower 模式减少不必要的线程唤醒
支持快速的队首元素访问和批量操作

Leader-Follower 模式辨析：

DelayedWorkQueue 中的 Leader-Follower 是一种线程等待优化模式，与 Raft 等分布式一致性协议中的 Leader 概念完全不同：

特性	DelayedWorkQueue Leader-Follower	Raft Leader
领域	单机并发编程	分布式一致性
Leader 角色	等待线程中的"定时等待者"	日志复制协调者
Leader 选举	自动轮换，先到先得	投票选举，多数派确认
核心目的	避免多线程同时定时等待的唤醒风暴	保证日志一致性
角色数量	任意时刻最多 1 个 leader	任意时刻最多 1 个 leader

DelayedWorkQueue 的 Leader-Follower 工作原理：

// DelayedWorkQueue.take() 的 Leader-Follower 逻辑
public RunnableScheduledFuture<?> take() throws InterruptedException {
    final ReentrantLock lock = this.lock;
    lock.lockInterruptibly();
    try {
        for (;;) {
            RunnableScheduledFuture<?> first = queue[0];
            if (first == null) {
                available.await();  // 无任务，无限等待
            } else {
                long delay = first.getDelay(NANOSECONDS);
                if (delay <= 0)
                    return finishPoll(first);  // 任务已到期，直接返回
                
                // Leader-Follower 核心逻辑
                if (leader != null) {
                    available.await();  // 已有 leader，当前线程作为 follower 无限等待
                } else {
                    Thread thisThread = Thread.currentThread();
                    leader = thisThread;  // 当前线程成为 leader
                    try {
                        available.awaitNanos(delay);  // leader 定时等待到任务到期
                    } finally {
                        if (leader == thisThread)
                            leader = null;  // leader 退出时清空
                    }
                }
            }
        }
    } finally {
        if (leader == null && queue[0] != null)
            available.signal();  // 唤醒一个 follower 成为新 leader
    }
}

为什么需要 Leader-Follower？

假设没有此模式，10 个线程同时调用 take() 等待 5 秒后的任务：

所有 10 个线程都调用 awaitNanos(5s)
5 秒后，所有 10 个线程同时被唤醒
但只有 1 个线程能获取任务，其余 9 个线程空转
这就是"惊群效应"或"唤醒风暴"

有了 Leader-Follower：

只有 1 个 leader 线程定时等待
其余 9 个 follower 线程无限等待
任务到期后 leader 取走任务，唤醒 1 个 follower 成为新 leader
始终只有 1 个线程被唤醒，避免唤醒风暴

这套实现既保证了定时任务调度的精确性，又通过巧妙的设计优化了内存使用和并发性能，体现了Doug Lea在并发编程方面的深厚功底。

为何 ArrayBlockingQueue 不需要 Leader-Follower？

ArrayBlockingQueue 也有队列为空、多个消费者阻塞的情况，但它不会惊群，原因在于唤醒机制：

// ArrayBlockingQueue.put() 放入任务时
public void put(E e) throws InterruptedException {
    lock.lock();
    try {
        // ... 入队操作
        notEmpty.signal();  // 只唤醒一个线程，不是 signalAll()
    } finally {
        lock.unlock();
    }
}

对比项	ArrayBlockingQueue	DelayedWorkQueue
等待方式	`await()` 无限等待	`awaitNanos(delay)` 定时等待
唤醒触发者	生产者调用 `signal()`	时间到期，系统自动触发
唤醒数量	`signal()` 只唤醒 1 个	所有 `awaitNanos` 线程同时醒来

ArrayBlockingQueue 的唤醒是可控的：生产者决定何时唤醒、唤醒几个，signal() 只唤醒一个线程
DelayedWorkQueue 的唤醒是时间驱动的：时间到期后系统会自动唤醒所有等待该时间的线程，无法用 signal() 精确控制
Leader-Follower 模式让只有 1 个线程去定时等待，其余线程无限等待，从而避免惊群

两者都在避免惊群，只是手段不同：ArrayBlockingQueue 用 signal() 解决；DelayedWorkQueue 无法用 signal() 解决（因为唤醒是时间驱动的），只能用 Leader-Follower 模式。

ScheduledExecutorService 与 AbstractExecutorService 的关系辨析

关键问题：API 之间是否也是 AbstractExecutorService 的调用关系？

答案：submit/invokeAll/invokeAny 仍遵循 AbstractExecutorService，但 schedule 系列方法是独立实现。execute() 被重写为调用 schedule(command, 0, NANOSECONDS)，使标准 API 的底层变为调度路径。

API 分类

ScheduledExecutorService 的 API 可以分为两类：

API 类别	方法	是否遵循 AbstractExecutorService	实现路径
标准 API	`submit(Runnable)`	是	`submit()` → `newTaskFor()` → `execute()` → `DelayedWorkQueue`
标准 API	`submit(Callable)`	是	`submit()` → `newTaskFor()` → `execute()` → `DelayedWorkQueue`
标准 API	`invokeAll()`	是	`invokeAll()` → `newTaskFor()` × N → `execute()` × N
标准 API	`invokeAny()`	是	`invokeAny()` → `newTaskFor()` × N → `execute()` × N
定时 API	`schedule(Runnable)`	否	`schedule()` → `new ScheduledFutureTask()` → `DelayedWorkQueue`
定时 API	`schedule(Callable)`	否	`schedule()` → `new ScheduledFutureTask()` → `DelayedWorkQueue`
定时 API	`scheduleAtFixedRate()`	否	`scheduleAtFixedRate()` → `new ScheduledFutureTask()` → `DelayedWorkQueue`
定时 API	`scheduleWithFixedDelay()`	否	`scheduleWithFixedDelay()` → `new ScheduledFutureTask()` → `DelayedWorkQueue`

实现对比

标准 API（遵循 AbstractExecutorService）：

// AbstractExecutorService 的默认实现
public Future<?> submit(Runnable task) {
    if (task == null) throw new NullPointerException();
    RunnableFuture<Void> ftask = newTaskFor(task, null);  // 创建 FutureTask
    execute(ftask);  // 调用 execute()
    return ftask;
}

// ScheduledThreadPoolExecutor.execute() 的实现
@Override
public void execute(Runnable command) {
    schedule(command, 0, NANOSECONDS);  // 转换为 schedule(0)
}

设计意图：execute() 的实现本质是语义转换——将"立即执行"转换为"延迟为0的调度"。这是API兼容性设计：ScheduledThreadPoolExecutor 继承自 ThreadPoolExecutor，必须实现 execute() 接口，但内部确保所有任务都走统一的调度路径（DelayedWorkQueue）-不延迟也得延迟。

与传统 ThreadPoolExecutor.execute() 的区别：

维度	ThreadPoolExecutor	ScheduledThreadPoolExecutor
语义	立即执行任务	延迟为0的调度任务
入队	直接入队	通过 `schedule()` → `delayedExecute()`
任务包装	可选	强制包装为 `ScheduledFutureTask`
队列	用户指定	强制 `DelayedWorkQueue`
时间字段	无	`time = now() + 0`

定时 API（独立实现）：

// ScheduledThreadPoolExecutor 的独立实现
public ScheduledFuture<?> schedule(Runnable command, long delay, TimeUnit unit) {
    if (command == null || unit == null)
        throw new NullPointerException();
    // 创建 ScheduledFutureTask，triggerTime 计算 deadline = now() + delay
    RunnableScheduledFuture<Void> t = decorateTask(command,
        new ScheduledFutureTask<Void>(command, null,
                                      triggerTime(delay, unit)));
    delayedExecute(t);  // 直接提交到 DelayedWorkQueue
    return t;
}

/**
 * 延迟任务入队的核心方法。
 * 
 * 【两次 isShutdown 检查的原因】
 * 这是典型的 TOCTOU（Time-Of-Check to Time-Of-Use）竞态处理：
 * - 第一次检查：快速路径，避免已关闭线程池的无意义入队
 * - 第二次检查：在 add(task) 期间，其他线程可能调用了 shutdown()，
 *             需要重新检查并决定是取消任务还是继续执行
 * 
 * 【为什么不在 ensurePrestart 之后检查？】
 * - ensurePrestart() 会启动工作线程，若线程池已关闭则不应启动
 * - 若任务已被取消（因关闭策略），启动线程执行它是无意义的
 * - 将检查前置，避免不必要的线程创建和资源浪费
 */
private void delayedExecute(RunnableScheduledFuture<?> task) {
    if (isShutdown())
        reject(task);  // 第一次检查：快速拒绝
    else {
        super.getQueue().add(task);  // 入队到 DelayedWorkQueue
        // 和普通的 TPE 一样，入队以后还要检查是不是有线程可以运行任务
        // 第二次检查：处理入队期间发生的关闭
        // canRunInCurrentRunState 检查关闭策略配置：
        // - 周期任务：continueExistingPeriodicTasksAfterShutdown
        // - 非周期任务：executeExistingDelayedTasksAfterShutdown
        if (isShutdown() &&
            !canRunInCurrentRunState(task.isPeriodic()) &&
            remove(task))  // 尝试从队列移除
            task.cancel(false);  // 移除成功则取消任务
        else
            ensurePrestart();  // 确保至少有一个工作线程运行，这一步类似 TPE 的其他补充线程方法
    }
}

/**
 * decorateTask：任务装饰器方法（钩子/扩展点）
 * 
 * 【设计意图】
 * 这是一个 protected 方法，用于子类扩展。默认实现直接返回传入的 task，
 * 子类可重写以包装或替换任务对象，实现自定义行为（如添加日志、追踪、装饰器模式）。
 * 
 * 【装饰器模式应用】
 * 典型用法：子类可返回包装后的任务，在外层添加拦截逻辑。
 * 例如：记录任务执行时间、添加异常处理、实现任务追踪等。
 * 
 * 【两个重载版本】
 * - decorateTask(Runnable, RunnableScheduledFuture)：用于 Runnable 任务
 * - decorateTask(Callable, RunnableScheduledFuture)：用于 Callable 任务
 */
protected <V> RunnableScheduledFuture<V> decorateTask(
    Runnable runnable, RunnableScheduledFuture<V> task) {
    return task;  // 默认实现：直接返回，不做任何装饰
}

protected <V> RunnableScheduledFuture<V> decorateTask(
    Callable<V> callable, RunnableScheduledFuture<V> task) {
    return task;  // 默认实现：直接返回，不做任何装饰
}

/**
 * ScheduledFutureTask：调度任务的核心内部类
 * 
 * 【类层次】
 * FutureTask ← ScheduledFutureTask（内部类）
 *                 ↑ implements RunnableScheduledFuture
 * 
 * 【核心职责】
 * 1. 承载延迟/周期执行的时间语义
 * 2. 实现 Comparable 接口，支持按触发时间排序
 * 3. 管理周期任务的重复执行逻辑
 */
private class ScheduledFutureTask<V>
        extends FutureTask<V> implements RunnableScheduledFuture<V> {

    /** 任务触发时间（纳秒级绝对时间戳）*/
    private long time;

    /** 序列号：用于 time 相同时的 FIFO 排序（先入队先执行）*/
    private final long sequenceNumber;

    /**
     * 周期任务的执行间隔（纳秒）：
     * - 0：非周期任务（一次性延迟任务）
     * - >0：固定速率执行（scheduleAtFixedRate）
     * - <0：固定延迟执行（scheduleWithFixedDelay，实际间隔为eriod）
     */
    private final long period;

    /** 实际被重新入队的任务引用（周期任务重新入队时使用）*/
    RunnableScheduledFuture<V> outerTask = this;

    /** 堆索引：支持 DelayedWorkQueue 的快速删除操作 */
    int heapIndex;

    /**
     * 一次性延迟任务的构造函数
     * @param r 要执行的任务
     * @param result 任务结果（对于 Runnable 通常为 null）
     * @param ns 触发时间（纳秒级绝对时间戳）
     */
    ScheduledFutureTask(Runnable r, V result, long ns) {
        super(r, result);
        this.time = ns;
        this.period = 0;
        this.sequenceNumber = sequencer.getAndIncrement();
    }

    /**
     * 周期任务的构造函数
     * @param r 要执行的任务
     * @param result 任务结果
     * @param ns 首次触发时间
     * @param period 执行间隔（>0 为固定速率，<0 为固定延迟）
     */
    ScheduledFutureTask(Runnable r, V result, long ns, long period) {
        super(r, result);
        this.time = ns;
        this.period = period;
        this.sequenceNumber = sequencer.getAndIncrement();
    }

    /**
     * 获取延迟时间：距离触发还有多久
     * @return 延迟纳秒数，<=0 表示已到期
     */
    public long getDelay(TimeUnit unit) {
        return unit.convert(time - now(), NANOSECONDS);
    }

    /**
     * 比较方法：按触发时间排序
     * 【排序规则】
     * 1. 先按 time 比较，时间小的先执行
     * 2. time 相同则按 sequenceNumber 比较，序列号小的先执行（FIFO）
     */
    public int compareTo(Delayed other) {
        if (other == this)  // 同一对象
            return 0;
        if (other instanceof ScheduledFutureTask) {
            ScheduledFutureTask<?> x = (ScheduledFutureTask<?>)other;
            long diff = time - x.time;
            if (diff < 0)
                return -1;
            else if (diff > 0)
                return 1;
            else if (sequenceNumber < x.sequenceNumber)
                return -1;
            else
                return 1;
        }
        // 与非 ScheduledFutureTask 比较：通过 getDelay 计算
        long diff = getDelay(NANOSECONDS) - other.getDelay(NANOSECONDS);
        return (diff < 0) ? -1 : (diff > 0) ? 1 : 0;
    }

    /** 是否为周期任务 */
    public boolean isPeriodic() {
        return period != 0;
    }
}

/**
 * triggerTime：计算任务的触发时间（纳秒级绝对时间戳）
 * 
 * 【计算逻辑】
 * 1. 将 delay 转换为纳秒
 * 2. 与当前时间相加，得到绝对触发时间
 * 
 * 【溢出处理】
 * 若 delay 过大（超过 Long.MAX_VALUE/2），调用 overflowFree 进行调整
 */
private long triggerTime(long delay, TimeUnit unit) {
    return triggerTime(unit.toNanos((delay < 0) ? 0 : delay));
}

/**
 * 内部方法：计算触发时间
 * 
 * 【溢出保护】
 * 若 delay 过大，直接与 now() 相加可能导致 long 溢出变成负数。
 * overflowFree 方法检测队列中是否有已溢出的任务，并调整当前 delay。
 */
private long triggerTime(long delay) {
    return now() + ((delay < (Long.MAX_VALUE >> 1)) ? delay : overflowFree(delay));
}

/**
 * 当前时间（纳秒）
 * 使用 System.nanoTime() 而非 System.currentTimeMillis()，
 * 原因：nanoTime 单调递增，不受系统时间调整影响。
 */
final long now() {
    return System.nanoTime();
}

/**
 * ensurePrestart：确保至少有一个工作线程运行
 * 
 * 【设计意图】
 * ScheduledThreadPoolExecutor 的任务入队后不走 ThreadPoolExecutor 的三段式判断，
 * 因此需要显式确保有线程在运行消费队列。这是与 TPE 的关键差异：
 * - TPE：execute() 内部判断是否需要创建线程
 * - STPE：schedule() → delayedExecute() → ensurePrestart() 显式创建
 * 
 * 【与 TPE.addWorker 的关系】
 * 内部调用 addWorker(null, true)，参数含义：
 * - firstTask=null：不绑定首任务，Worker 启动后从队列取任务
 * - core=true：使用 corePoolSize 作为线程上限判断
 * 
 * 【为什么用 core=true？】
 * STPE 的线程数通常由 corePoolSize 决定（构造时传入），
 * maximumPoolSize 在 STPE 中意义不大（队列永不满）。
 * 使用 core=true 确保：线程数未达 corePoolSize 才创建新线程。
 */
void ensurePrestart() {
    int wc = workerCountOf(ctl.get());
    if (wc < corePoolSize)
        addWorker(null, true);  // 未达核心线程数，创建核心线程
    else if (wc == 0)
        addWorker(null, false); // 核心线程数为0时，创建非核心线程（兜底）
}

延时调度的本质：延时语义由队列层实现——schedule() 创建带 deadline 的 ScheduledFutureTask 并入队。Worker 线程调用 getTask() → DelayedWorkQueue.take() 时会阻塞直到队首任务到期，之后完全复用 ThreadPoolExecutor 的执行机制。

TPE 系的线程池都有一个原则：入队以后要确认线程池状态和线程数量，如果需要就补，如果有就出队，避免中队列中死等。

对比图示

graph TB
    subgraph "标准 API（遵循 AbstractExecutorService）"
        A1[submit Runnable] --> B1[newTaskFor]
        B1 --> C1[FutureTask]
        C1 --> D1[execute]
        D1 --> E1[schedule0]
        E1 --> F1[DelayedWorkQueue]
        
        A2[submit Callable] --> B2[newTaskFor]
        B2 --> C2[FutureTask]
        C2 --> D1
        
        A3[invokeAll] --> B3[newTaskFor xN]
        B3 --> C3[FutureTask xN]
        C3 --> D3[execute xN]
        D3 --> E3[schedule0 xN]
        E3 --> F3[DelayedWorkQueue]
    end
    
    subgraph "定时 API（独立实现）"
        A4[schedule Runnable] --> B4[new ScheduledFutureTask]
        B4 --> C4[delayedExecute]
        C4 --> D4[DelayedWorkQueue]
        
        A5[schedule Callable] --> B5[new ScheduledFutureTask]
        B5 --> C5[delayedExecute]
        C5 --> D4
        
        A6[scheduleAtFixedRate] --> B6[new ScheduledFutureTask periodic]
        B6 --> C6[delayedExecute]
        C6 --> D4
        
        A7[scheduleWithFixedDelay] --> B7[new ScheduledFutureTask periodic]
        B7 --> C7[delayedExecute]
        C7 --> D4
    end
    
    style B4 fill:#FFD700
    style B5 fill:#FFD700
    style B6 fill:#FFD700
    style B7 fill:#FFD700
    style C4 fill:#FFD700
    style C5 fill:#FFD700
    style C6 fill:#FFD700
    style C7 fill:#FFD700

关键结论

标准 API：submit()、invokeAll()、invokeAny() 仍然遵循 AbstractExecutorService 的契约
- 通过 newTaskFor() 创建 FutureTask
- 调用 execute()，最终转换为 schedule(0)
定时 API：schedule() 系列方法是独立实现
- 直接创建 ScheduledFutureTask（而非 FutureTask）
- 调用 delayedExecute()，直接提交到 DelayedWorkQueue
- 不经过 execute() 路径
任务类型差异：
- FutureTask：普通任务，执行一次即完成
- ScheduledFutureTask：定时任务，支持延迟执行和周期执行，继承自 FutureTask
队列差异：
- 标准 API：通过 schedule(0) 间接使用 DelayedWorkQueue
- 定时 API：直接使用 DelayedWorkQueue，支持基于时间的优先级排序

这个设计体现了 ScheduledExecutorService 的双重性质：既要兼容 ExecutorService 标准接口，又要为定时任务提供专门的实现。

ScheduledExecutorService 核心机制详解

Future.get() 的语义差异：一次性任务 vs 周期任务

根据 ScheduledFuture 的规范，Future.get() 方法在一次性任务和周期任务中的行为截然不同：

一次性任务：

get() 会阻塞直到任务执行完成
可以正常获取任务执行结果或捕获异常
任务完成后立即返回，这是预期行为

ScheduledFuture<String> future = executor.schedule(() -> {
    return "task completed";
}, 1, TimeUnit.SECONDS);

String result = future.get(); // 阻塞直到任务完成，正常返回 "task completed"

周期任务：

get() 基本不会"正常返回"，因为周期任务的设计语义是"无限期执行"
只在以下两种情况返回：
1. 任务被取消（cancel() 被调用）
2. 任务执行过程中抛出未捕获的异常
调用 get() 会导致调用线程永久阻塞（直到上述情况发生）

ScheduledFuture<?> future = executor.scheduleAtFixedRate(() -> {
    System.out.println("tick");
}, 0, 1, TimeUnit.SECONDS);

// future.get(); // 永久阻塞！不要这样做

为什么这样设计？
这是有意为之的设计，强制用户通过 cancel() 来主动终止周期任务。周期任务没有自然的"完成"状态，因此 get() 无法判断何时应该返回。

串行化铁律：单一任务串行，不同任务并行

根据 ScheduledThreadPoolExecutor 的源码实现，存在一个重要的"串行化铁律"：

单一周期任务的串行化：

同一个 ScheduledFutureTask 对象在 run() 方法完成后才会计算下次触发时间并重新入队
因此同一个周期任务实例不可能并发执行
这个铁律适用于 scheduleAtFixedRate 和 scheduleWithFixedDelay 两种模式

sequenceDiagram
    participant Worker as Worker线程
    participant Queue as DelayedWorkQueue
    participant Task as ScheduledFutureTask
    
    Note over Worker,Task: 周期任务的串行化执行
    Worker->>Queue: take()
    Queue-->>Worker: 返回到期任务
    Worker->>Task: 执行 run()
    Note over Worker: 执行任务逻辑
    Worker->>Task: run() 完成
    Task->>Task: setNextRunTime()
    Task->>Queue: 重新入队（同一对象）
    
    Note over Worker,Task: 下一次执行
    Worker->>Queue: take()
    Queue-->>Worker: 再次返回同一任务
    Worker->>Task: 执行 run()

不同任务的并行化：

多个独立的任务（即使执行相同的 Runnable）可以并行执行
只要线程池有足够线程，不同任务可以同时运行

// 任务1和任务2是不同的 ScheduledFutureTask 实例，可以并行执行
ScheduledFuture<?> future1 = executor.scheduleAtFixedRate(taskA, 0, 1, TimeUnit.SECONDS);
ScheduledFuture<?> future2 = executor.scheduleAtFixedRate(taskA, 0, 1, TimeUnit.SECONDS);

// 但 future1 内部的执行是串行的，不会并发

设计原因：
周期任务复用同一个 ScheduledFutureTask 对象，在执行期间不会创建新的任务对象入队，这天然保证了单一任务的串行化。

设计原理详解

ScheduledFutureTask.run() 的周期任务分支实现详见 ScheduledFutureTask 的实现，核心逻辑：super.runAndReset() -> setNextRunTime() -> reExecutePeriodic(outerTask)。

sequenceDiagram
    participant Worker as Worker线程
    participant Queue as DelayedWorkQueue
    participant Task as ScheduledFutureTask
    
    rect rgb(200, 220, 240)
        Note over Worker,Task: 第一次执行
        Worker->>Queue: take() 取出任务
        Queue-->>Worker: 返回任务
        Worker->>Task: 执行 run()
        Note over Worker: 执行任务逻辑
        Worker->>Task: run() 完成
        Task->>Task: setNextRunTime()
        Task->>Queue: reExecutePeriodic(同一对象)
    end
    
    rect rgb(220, 240, 220)
        Note over Worker,Task: 第二次执行
        Worker->>Queue: take() 取出同一任务
        Queue-->>Worker: 返回任务
        Worker->>Task: 执行 run()
        Note over Worker: 执行任务逻辑
        Worker->>Task: run() 完成
        Task->>Task: setNextRunTime()
        Task->>Queue: reExecutePeriodic(同一对象)
    end

设计优势：

内存效率：避免为每次执行创建新对象
串行化保证：因为复用同一个对象，且只有在当前执行完成后才重新入队，所以不会存在"同一个任务的多个实例同时待执行"
追赶机制：追赶逻辑在 setNextRunTime() 中根据时间戳计算，即使追赶多次，也是串行重新入队

这就是串行追赶的本质设计原因。

漂移（Drift）：线程池过小导致的执行延迟

漂移的定义：
漂移是指任务的实际执行时间偏离了理论调度时间。当线程池过小或任务执行时间过长时：

到期的任务从 DelayedWorkQueue 中取出后，可能因为线程池繁忙而需要等待
即使任务已经"到期"，也无法立即执行，只能等待可用线程
这导致执行时间晚于理论时间，产生"漂移"效应

gantt
    title 漂移效应示意图（period=1s，执行时间=1.5s）
    dateFormat X
    axisFormat %s
    
    section 理论时间轴
    执行1 : 0, 1
    执行2 : 1, 2
    执行3 : 2, 3
    
    section 实际执行（线程池过小）
    等待队列 : 0, 0.5
    执行1 : 0.5, 2
    等待队列 : 2, 2.5
    执行2 : 2.5, 4
    等待队列 : 4, 4.5
    执行3 : 4.5, 6

漂移的影响：

scheduleAtFixedRate：漂移会触发追赶机制，在短时间内执行更密集
scheduleWithFixedDelay：漂移会延迟整个时间轴，不会追赶，表现为节奏变慢

避免漂移的建议：

合理设置线程池大小，避免线程不足
控制任务执行时间，避免长时间阻塞
监控任务执行延迟，及时调整配置

API 参数语义：delay vs period

统一的时间参数模式：
所有 ScheduledExecutorService 的方法都采用 (long time, TimeUnit unit) 的参数模式，这是 JUC 的统一设计风格。

delay 的语义：

表示"延迟多久后首次执行"
只影响第一次执行
是一次性的时间偏移

period 的语义：

表示"周期性执行的间隔"
决定后续执行的节奏
计算方式在不同 API 中有差异：

API	period 计算	是否追赶	适用场景
`scheduleAtFixedRate`	`上次理论触发时间 + period`	是	采样、心跳、metrics 上报
`scheduleWithFixedDelay`	`上次实际结束时间 + period`	否	拉取消息、轮询、清理任务

示例：

// delay=2s, period=1s
ScheduledExecutorService executor = Executors.newScheduledThreadPool(1);
Runnable task = () -> System.out.println("Task executed");
executor.scheduleAtFixedRate(task, 2, 1, TimeUnit.SECONDS);
// 首次执行：延迟2秒后执行
// 后续执行：每隔1秒执行一次（基于理论时间轴）

executor.scheduleWithFixedDelay(task, 2, 1, TimeUnit.SECONDS);
// 首次执行：延迟2秒后执行
// 后续执行：上次执行结束后，再等待1秒执行（基于实际结束时间）

周期任务异常终止的深度解析

根本原因：任务对象不再重新入队

普通 ThreadPoolExecutor 的异常处理机制:

ThreadPoolExecutor executor = new ThreadPoolExecutor(4, 8, 60, TimeUnit.SECONDS, new LinkedBlockingQueue<>());

executor.execute(() -> {
    throw new RuntimeException("Task execution failed");
});

执行流程:

Worker 线程执行任务，任务抛出未捕获异常
Worker 线程在 Worker.run() 的 finally 块中捕获异常
Worker 线程继续存活，从队列取下一个任务
若 Worker 线程数 < corePoolSize，线程池补充新线程

周期任务的异常处理机制:

ScheduledExecutorService executor = Executors.newScheduledThreadPool(4);

executor.scheduleAtFixedRate(() -> {
    throw new RuntimeException("Task execution failed");
}, 0, 1, TimeUnit.SECONDS);

执行流程:

Worker 线程执行 ScheduledFutureTask.run()
ScheduledFutureTask.run() 调用 FutureTask.runAndReset()
runAndReset() 捕获异常，设置异常状态，返回 false
ScheduledFutureTask.run() 检查返回值，仅当返回 true 时重新入队
ScheduledFutureTask 对象不再重新入队，后续调度终止

核心源码分析:

// FutureTask.runAndReset() (JDK 8 源码)
protected boolean runAndReset() {
    // CAS 抢占 runner：多个线程可能同时调用 run()，CAS 保证只有一个成功
    // 比较 runnerOffset 位置的值是否为 null，是则设为当前线程
    if (state != NEW ||
        !UNSAFE.compareAndSwapObject(this, runnerOffset,
                                     null, Thread.currentThread()))
        return false;
    boolean ran = false;
    int s = state;
    try {
        Callable<V> c = callable;
        if (c != null && s == NEW) {
            try {
                c.call(); // don't set result
                ran = true;
            } catch (Throwable ex) {
                setException(ex);
            }
        }
    } finally {
        // runner must be non-null until state is settled to
        // prevent concurrent calls to run()
        // finally 中直接赋值：此时任务已执行完，当前线程是唯一持有 runner 的线程，无竞争
        runner = null;
        // state must be re-read after nulling runner to prevent
        // leaked interrupts
        s = state;
        if (s >= INTERRUPTING)
            handlePossibleCancellationInterrupt(s);
    }
    return ran && s == NEW;
}

// ScheduledFutureTask.run() (JDK 8 源码)
public void run() {
    boolean periodic = isPeriodic();                      // 判断是否周期任务
    if (!canRunInCurrentRunState(periodic))               // 线程池状态检查
        cancel(false);
    else if (!periodic)                                   // 一次性任务：调用父类 run()
        ScheduledFutureTask.super.run();                  //    正常执行并设置结果
    else if (ScheduledFutureTask.super.runAndReset()) {   // 周期任务：执行并重置状态
        setNextRunTime();                                 //    计算下次执行时间
        reExecutePeriodic(outerTask);                     //    重新入队同一任务对象
    }                                                     // 若 runAndReset() 返回 false（异常），不重新入队
}

为什么 CAS 设置 runner，finally 中直接赋值？

runner 字段的两种操作场景：

操作	场景	并发风险	实现方式
设置 runner	任务开始前，多线程可能同时调用 run()	多个线程竞争执行同一任务	CAS 原子操作
清空 runner	任务完成后，finally 块	当前线程独占，无竞争	直接赋值

CAS 保证只有一个线程能成功设置 runner 并执行任务。finally 块中当前线程已持有 runner，不存在竞争，直接置 null 即可。

深入理解：为什么 ThreadPoolExecutor 场景下仍需 CAS？

从 ThreadPoolExecutor 的视角看，getTask() 从 BlockingQueue 取任务是独占的，不会有两个 Worker 拿到同一个 FutureTask。但 CAS 设置 runner 的必要性来自更广的场景：

FutureTask 是通用组件，不依赖 ThreadPoolExecutor 的队列语义

FutureTask<String> task = new FutureTask<>(() -> "result");
// 用户可以手动在多个线程中调用 run()
new Thread(task::run).start();
new Thread(task::run).start();  // 第二次应被幂等拒绝

cancel(true) 与 run() 的竞争——这是核心场景

cancel(true) 需要先 CAS 改状态再中断 runner，而 run() 需要先绑定 runner 再执行：

// cancel(true) 路径
if (UNSAFE.compareAndSwapInt(this, stateOffset, NEW, INTERRUPTING)) {
    runner.interrupt();  // 需要 runner 已被设置
}

// run() 路径
if (state != NEW || !UNSAFE.compareAndSwapObject(this, runnerOffset, null, Thread.currentThread()))
    return;  // 若 cancel 已改状态，这里直接返回

两者形成互斥：要么 run() 先 CAS 成功绑定 runner 再执行，要么 cancel() 先 CAS 改状态使 run() 的状态检查失败。

runAndReset() 的重入场景

ScheduledThreadPoolExecutor 的周期任务会多次调用 runAndReset()，虽然是同一个 Worker，但每次执行仍需 CAS 来与潜在的 cancel() 竞争。

简言之：CAS runner 不是防多 Worker 竞争，而是防 run()/runAndReset() 与 cancel() 的并发竞争，同时保证 FutureTask 作为独立组件的幂等性。

异常终止的根本原因：

runAndReset() 仅在 c.call() 正常完成时返回 true。若抛出异常，ran 保持 false，最终返回 false，ScheduledFutureTask.run() 不会重新入队任务。

这解释了为什么周期任务中的未捕获异常会导致后续调度终止：任务对象不再入队。

执行流程图:

sequenceDiagram
    participant Worker as Worker线程
    participant Task as ScheduledFutureTask
    participant Queue as DelayedWorkQueue
    
    rect rgb(220, 255, 220)
    Note over Worker,Queue: 正常执行流程
    Worker->>Task: run()
    Task->>Task: runAndReset() 内部调用
    Task->>Task: callable.call()
    Note right of Task: 返回 true
    Task->>Task: setNextRunTime()
    Task->>Queue: reExecutePeriodic() 重新入队
    Task-->>Worker: 完成
    Note over Queue: 等待下次执行
    end
    
    rect rgb(255, 220, 220)
    Note over Worker,Queue: 异常执行流程
    Worker->>Task: run()
    Task->>Task: runAndReset() 内部调用
    Task->>Task: callable.call() 抛出异常
    Task->>Task: setException(e)
    Note right of Task: 返回 false
    Task-->>Worker: 完成
    Note over Queue: 任务不再重新入队，后续调度终止
    end

异常处理机制对比:

维度	普通任务	周期任务
任务类型	每次是新 Runnable 对象	同一个 ScheduledFutureTask 对象重复执行
异常处理位置	Worker.run() 的 finally 块	FutureTask.runAndReset()
异常后的行为	Worker 线程继续，取下一个任务	任务对象不再重新入队
线程池补充	补充新线程(如需要)	Worker 线程正常，但任务不再调度
后续任务影响	不受影响(不同任务)	同一任务的后继执行全部终止

设计原理:

该行为属于有意为之的设计决策，基于以下考量:

语义明确性: 周期任务抛出异常表明任务逻辑存在问题，继续执行可能导致资源泄漏或数据不一致
错误可见性: 若自动重试，异常将被静默吞掉，开发者难以发现潜在问题
符合 Javadoc 规范: scheduleAtFixedRate 的 javadoc 明确说明 “If any execution of the task encounters an exception, subsequent executions are suppressed”
显式异常处理: 强制用户明确决定异常处理策略(重试、忽略、告警等)

其他分布式系统的异常处理策略

不同的分布式调度系统有不同的设计理念:

Spring @Scheduled:

@Scheduled(fixedRate = 1000)
public void scheduledTask() {
    // 如果这里抛异常，后续执行会终止
    throw new RuntimeException("Oops!");
}

默认行为: 与 JUC 一致，异常后终止调度
最佳实践: 必须捕获异常

Quartz Scheduler:

public class MyJob implements Job {
    @Override
    public void execute(JobExecutionContext context) {
        // 异常后，Job 会标记为 FAILED
        throw new RuntimeException("Oops!");
    }
}

默认行为: 异常后任务标记为 FAILED，但仍然会继续调度(默认)
配置选项: 可以配置 @DisallowConcurrentExecution 等策略
重试机制: 支持配置重试次数和间隔

XXL-Job:

@XxlJob("demoJobHandler")
public ReturnT<String> demoJobHandler(String param) {
    // 返回 FAIL 会导致任务失败，但仍然会继续调度
    return ReturnT.FAIL;
}

默认行为: 异常后任务标记为失败，但仍然会继续调度
失败重试: 支持配置重试次数
告警机制: 失败后会触发告警

Celery (Python):

@app.task(bind=True, max_retries=3)
def my_task(self):
    try:
        # 任务逻辑
        pass
    except Exception as exc:
        # 自动重试
        raise self.retry(exc=exc, countdown=60)

默认行为: 异常后任务失败，但仍然会继续调度
自动重试: 支持配置重试策略
任务状态: 区分 PENDING、STARTED、SUCCESS、FAILURE、RETRY 等

对比总结:

系统	异常后行为	重试机制	设计理念
JUC ScheduledExecutorService	终止调度	无	失败即停止，让用户显式处理
Spring @Scheduled	终止调度	无	遵循 JUC 规范
Quartz	继续调度	可配置	企业级，容错性强
XXL-Job	继续调度	可配置	分布式，高可用
Celery	继续调度	可配置	云原生，弹性伸缩

为什么 JUC 选择"失败即停止"?

简洁性: 不引入复杂的重试逻辑
可预测性: 行为明确，不会因为重试导致问题扩散
灵活性: 用户可以自己实现重试逻辑
符合 Unix 哲学: “提供机制而非策略”

分布式任务调度系统的设计思路对比

前文提到，JUC 的周期任务采用"任务重复入队"的设计思路，异常时打断入队会导致调度终止。但并非所有分布式任务调度系统都采用这种设计。不同系统的核心差异在于：任务调度的触发机制和任务状态的持久化方式。

两种核心设计思路

思路一:任务重复入队(自驱动模式)

代表系统:JUC ScheduledExecutorService、Spring @Scheduled

设计原理:任务对象自身负责计算下次执行时间并重新入队
触发机制:基于内存队列的延迟调度
状态管理：任务状态存储在内存中，进程重启后丢失
异常处理：异常时任务对象不再入队，调度终止

核心代码见上文周期任务异常终止的深度解析章节，关键点是 runAndReset() 返回 true 时才重新入队，异常时不入队。

思路二:调度中心驱动(中心化模式)

代表系统:阿里 SchedulerX、美团 Crane、XXL-JOB、Quartz

设计原理：独立的调度中心负责任务触发，执行器仅负责执行
触发机制:基于数据库/注册中心的定时触发
状态管理：任务状态持久化到数据库，进程重启后可恢复
异常处理：异常不影响调度中心下次触发，任务状态独立管理

flowchart LR
    SC[调度中心<br/>Scheduler] -->|触发| EX[执行器 A<br/>Executor]
    DB[数据库<br/>持久化] -->|读取状态| EX
    EX -->|更新状态| DB
    SC -->|下次触发<br/>仍会执行| EX
    EX -->|失败不影响| SC

阿里 SchedulerX 的设计

核心特性:

中心化调度架构：调度中心独立部署，负责任务触发和状态管理
失败自动重试:支持实例级别和子任务级别的失败重试
分布式执行：支持分片任务，多个执行器并行处理
状态持久化:任务执行状态存储在数据库中

异常处理流程:

sequenceDiagram
    participant SC as 调度中心
    participant DB as 数据库
    participant EX as 执行器
    
    SC->>DB: 查询待执行任务
    SC->>EX: 触发任务执行
    EX->>EX: 执行任务逻辑
    EX->>DB: 更新执行状态
    
    alt 执行成功
        DB->>SC: 标记为 SUCCESS
    else 执行失败
        DB->>SC: 标记为 FAILED
        SC->>SC: 检查重试策略
        alt 未达到重试上限
            SC->>DB: 计算下次重试时间
            SC->>EX: 重新触发任务
        else 达到重试上限
            DB->>SC: 标记为最终失败
            SC->>SC: 触发告警
        end
    end
    
    Note over SC,DB: 下次调度时间到达时，不论上次成功或失败，都会重新触发

关键点:

调度中心根据 Cron 表达式或固定间隔计算下次触发时间
任务执行失败不影响调度中心的触发逻辑
支持配置重试次数和重试间隔
任务状态独立于调度触发

美团 Crane 的设计

核心特性:

分布式调度:基于 ZooKeeper 的分布式协调
故障转移：执行器宕机时，任务自动转移到其他节点
任务分片:支持大任务分片并行处理
监控告警:集成 CAT 监控系统

异常处理流程:

sequenceDiagram
    participant ZK as ZooKeeper
    participant SC as 调度节点
    participant EX as 执行器
    participant DB as 数据库
    
    SC->>ZK: 注册任务调度
    ZK->>EX: 选举主执行器
    EX->>EX: 执行任务
    EX->>DB: 记录执行日志
    
    alt 执行成功
        DB->>ZK: 更新任务状态为 SUCCESS
    else 执行失败
        DB->>ZK: 更新任务状态为 FAILED
        ZK->>ZK: 检查重试策略
        alt 支持重试
            ZK->>EX: 重新分配任务
        else 不支持重试
            ZK->>SC: 触发告警
        end
    end
    
    Note over ZK: 下次调度时间到达时，仍然会触发任务

关键点:

基于 ZooKeeper 实现分布式协调和故障转移
任务调度和执行状态持久化到数据库
执行器宕机不影响调度，任务会自动转移到其他节点
支持任务分片和并行执行

两种设计思路的优缺点对比

维度	任务重复入队(自驱动)	调度中心驱动(中心化)
架构复杂度	简单，单进程内完成	复杂，需要独立的调度中心
异常处理	异常即终止，需手动重启	异常不影响调度，自动重试
状态持久化	无，进程重启丢失	有，数据库持久化
分布式能力	无，单机调度	有，支持分布式执行
故障恢复	无，进程崩溃任务丢失	有，任务可恢复和转移
监控告警	需自行实现	内置监控告警
适用场景	简单定时任务，单机应用	企业级应用，分布式系统
资源消耗	低，仅内存队列	高，需要数据库和调度中心
实时性	高，内存队列延迟低	中，依赖数据库查询
扩展性	差，单机限制	好，可水平扩展

为什么 JUC 采用任务重复入队设计?

JUC 的设计目标与分布式调度系统完全不同:

定位：本地进程内的轻量级调度，而非分布式调度
性能：基于内存队列，避免数据库开销
简单性：保持 API 简洁，不引入外部依赖
可控性：异常终止让用户显式处理，避免隐式重试掩盖问题

典型适用场景:

定期清理缓存
定期刷新配置
定期上报指标
定期检查状态

这些场景的特点是:

任务逻辑简单，失败即终止
不需要分布式执行
不需要持久化状态
需要高性能和低延迟

不适用场景:

需要跨进程调度
需要任务持久化
需要自动故障恢复
需要分布式执行

对于这些场景，应该使用分布式任务调度系统(如 SchedulerX、XXL-JOB 等)。

设计模式总结

[PATTERN] 自驱动 vs 中心驱动模式

自驱动模式:

定义:任务对象自身负责调度逻辑
优点:简单、高效、低延迟
缺点:无持久化、无故障恢复、不支持分布式
适用:单机轻量级调度

中心驱动模式:

定义:独立的调度中心负责任务触发
优点:持久化、故障恢复、分布式支持
缺点:复杂度高、资源消耗大、延迟较高
适用:企业级分布式调度

选择原则:

单机简单场景 → 自驱动模式(JUC ScheduledExecutorService)
分布式复杂场景 → 中心驱动模式(SchedulerX、XXL-JOB)

如何实现自动重试?

如需实现类似 Quartz 的行为，可自行封装：

public class ResilientScheduledExecutor {
    private final ScheduledExecutorService executor;
    
    public ScheduledFuture<?> scheduleWithRetry(Runnable task, long delay, long period, TimeUnit unit) {
        return executor.scheduleAtFixedRate(() -> {
            try {
                task.run();
            } catch (Throwable t) {
                // 记录异常，但不影响后续调度
                logger.error("Task failed but will retry", t);
            }
        }, delay, period, unit);
    }
}

铁律：周期任务必须捕获所有异常并记录，否则会出现"定时任务一段时间后不再执行"的现象。

setRemoveOnCancelPolicy(true) 的重要性

默认行为：

cancel() 只标记任务为"已取消"
任务对象仍留在 DelayedWorkQueue 中
直到到期取出时才发现已取消并跳过

问题场景：

// 每个请求都 schedule 一个超时任务
for (Request req : requests) {
    ScheduledFuture<?> timeout = executor.schedule(() -> {
        handleTimeout(req);
    }, 5, TimeUnit.SECONDS);
    
    req.addTimeoutFuture(timeout);
}

// 请求完成后取消
timeout.cancel(false); // 默认不移除，队列堆满已取消任务

开启移除策略：

1 2	`ScheduledThreadPoolExecutor executor = new ScheduledThreadPoolExecutor(4); executor.setRemoveOnCancelPolicy(true); // 强烈建议开启`

效果：

cancel() 时立即从队列移除任务
减少队列扫描开销和内存占用
强烈推荐用于"每个请求都 schedule 超时任务"的场景

time 字段的可复用设计

DelayedWorkQueue 的核心机制：
DelayedWorkQueue 基于 Delayed 接口的 getDelay() 方法：

1
2
3

public interface Delayed extends Comparable<Delayed> {
    long getDelay(TimeUnit unit);
}

ScheduledFutureTask 的 time 字段：

class ScheduledFutureTask<V> extends FutureTask<V> implements RunnableScheduledFuture<V> {
    private long time;  // 纳秒级 deadline
    
    public long getDelay(TimeUnit unit) {
        return unit.convert(time - now(), TimeUnit.NANOSECONDS);
    }
    
    public int compareTo(Delayed other) {
        if (other == this) return 0;
        if (other instanceof ScheduledFutureTask) {
            ScheduledFutureTask<?> x = (ScheduledFutureTask<?>)other;
            long diff = this.time - x.time;
            return diff < 0 ? -1 : diff > 0 ? 1 : 0;
        }
        long diff = getDelay(TimeUnit.NANOSECONDS) - other.getDelay(TimeUnit.NANOSECONDS);
        return diff < 0 ? -1 : diff > 0 ? 1 : 0;
    }
}

经典的可复用设计：

time 字段用于堆排序（compareTo 基于 time）
time 字段用于判断是否到期（getDelay() 计算剩余时间）
可复用：周期任务重新入队时，只需更新 time 字段，无需新建对象

这是一个经典的时间轮/延迟队列设计模式，高效且内存友好。

理论时间轴 vs 当下时间起点：Rate vs Delay 的根本差异

setNextRunTime() 完整源码：

/**
 * 计算下次执行时间（周期任务专用）
 * 
 * period 的三种值：
 * - period > 0：fixed-rate 模式，基于理论时间轴累加
 * - period < 0：fixed-delay 模式，基于当前时间重新计算
 * - period = 0：不会进入此方法（isPeriodic() 返回 false）
 */
private void setNextRunTime() {
    long p = period;
    if (p > 0)
        time += p;              // fixed-rate：累加，基于理论时间轴
    else
        time = triggerTime(-p);  // fixed-delay：重新计算，基于当前时间
}

// triggerTime 辅助方法：计算绝对时间戳
private long triggerTime(long delay) {
    return now() + ((delay < (Long.MAX_VALUE >> 1)) ? delay : overflowFree(delay));
}

period 字段的编码设计：

period 值	含义	时间计算	追赶行为
`> 0`	fixed-rate	`time += period`	会追赶
`< 0`	fixed-delay	`time = now() + (-period)`	不追赶
`= 0`	一次性任务	不调用 setNextRunTime	无

period 正负的来源：调度方法中的编码：

用户调用 scheduleAtFixedRate(task, 0, 1, SECONDS) 时传入的是正数 period，但 period 字段的正负是在 STPE 的调度方法中决定的：

// scheduleAtFixedRate：period 存为正数
public ScheduledFuture<?> scheduleAtFixedRate(Runnable command,
                                              long initialDelay,
                                              long period,
                                              TimeUnit unit) {
    if (command == null || unit == null)
        throw new NullPointerException();
    if (period <= 0)
        throw new IllegalArgumentException();
    ScheduledFutureTask<Void> t = new ScheduledFutureTask<Void>(command, null,
                                          triggerTime(initialDelay, unit),
                                          unit.toNanos(period));  // 正数
    delayedExecute(t);
    return t;
}

// scheduleWithFixedDelay：period 存为负数
public ScheduledFuture<?> scheduleWithFixedDelay(Runnable command,
                                                  long initialDelay,
                                                  long delay,
                                                  TimeUnit unit) {
    if (command == null || unit == null)
        throw new NullPointerException();
    if (delay <= 0)
        throw new IllegalArgumentException();
    ScheduledFutureTask<Void> t = new ScheduledFutureTask<Void>(command, null,
                                          triggerTime(initialDelay, unit),
                                          unit.toNanos(delay) * -1);  // 取负！
    delayedExecute(t);
    return t;
}

关键行：unit.toNanos(delay) * -1。API 参数 delay 是正数，但存储到 period 字段时主动取负，以此区分两种模式。这是内部编码约定，调用者无感知。

period 字段的双重编码设计：

period 字段同时承载两个信息：

绝对值：延迟时间（纳秒数）
正负号：计算模式标识

这种编码技巧在 JDK 中常见，类似：

ThreadPoolExecutor.ctl：高 3 位存状态，低 29 位存线程数
ForkJoinPool.config：高 16 位存并行度，低 16 位存模式
HashMap hash 高位用于判断节点类型

优点：

节省字段：无需额外存储 enum Mode { FIXED_RATE, FIXED_DELAY }
单分支判断：if (p > 0) 一个条件区分两种模式
值即含义：|period| 是时间，sign(period) 是模式

代价是可读性稍差，需要文档说明。

scheduleAtFixedRate（固定频率）：

基于理论时间轴：startTime + n * period
下次触发时间 = 上次理论触发时间 + period
如果执行延迟，会追赶：nextTime = max(now, theoreticalTime)


gantt
    title scheduleAtFixedRate：理论时间轴（period=1s）
    dateFormat X
    axisFormat %s
    
    section 理论时间轴
    触发1 : 0, 1
    触发2 : 1, 2
    触发3 : 2, 3
    触发4 : 3, 4
    
    section 实际执行（执行慢）
    执行1 : 0, 1.5
    追赶 : 1.5, 2
    执行2 : 2, 3
    执行3 : 3, 4
    执行4 : 4, 5

scheduleWithFixedDelay（固定延迟）：

基于当下时间起点：endTime + period
下次触发时间 = 上次实际结束时间 + period
不会追赶：执行越慢，整个时间轴越往后推

对应 setNextRunTime() 的 else 分支：time = triggerTime(-p)，详见上文源码。

gantt
    title scheduleWithFixedDelay：当下时间起点（delay=1s）
    dateFormat X
    axisFormat %s
    
    section 执行时间轴
    执行1 : 0, 1.5
    等待1s : 1.5, 2.5
    执行2 : 2.5, 3.5
    等待1s : 3.5, 4.5
    执行3 : 4.5, 6
    等待1s : 6, 7

核心差异：

Rate：基于理论时间轴，产生追赶效应
Delay：基于当下时间起点，不产生追赶效应

这就是两套 API 产生追赶或者不追赶的根本原因。

工程级最佳实践

周期任务的三条铁律：

永远捕获 Throwable，避免任务因为异常而静默停止
永远加超时（IO/锁等待/远程调用）
永远可取消 + 可观测（日志/metrics/最后成功时间）

不要完全替代 cron：
如需实现“每天 02:00”（墙上时钟语义、时区/DST/补偿错过的执行）等调度需求，ScheduledExecutorService 能力不足，更适合使用：

Quartz
Spring @Scheduled(cron=...)（底层常用线程池，但语义更偏 cron）

ScheduledExecutor 更擅长：

“从现在开始每隔 5 秒”
“延迟 200ms 后做一次”
“固定节拍采样/心跳”

任务隔离：
不同性质任务分不同 scheduler：

一个专门跑心跳/采样（轻量）
一个专门跑清理/同步（可能重 IO）
否则重任务会把轻任务拖延，造成级联误判（比如心跳延迟导致误判下游故障）。

生产级配置示例：

import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicLong;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

/**
 * 生产级ScheduledExecutor配置示例
 * 
 * 关键特性：
 * 1. 周期任务异常捕获
 * 2. 任务执行指标记录
 * 3. 优雅关闭机制
 * 4. 取消策略配置
 * 
 * @author magicliang
 * @since 2026-01-24
 */
public final class SchedulerDemo {
    private static final Logger logger = LoggerFactory.getLogger(SchedulerDemo.class);
    
    private final ScheduledThreadPoolExecutor exec;
    private final AtomicLong successCount = new AtomicLong(0);
    private final AtomicLong failureCount = new AtomicLong(0);
    private volatile ScheduledFuture<?> future;

    public SchedulerDemo() {
        exec = new ScheduledThreadPoolExecutor(2, r -> {
            Thread t = new Thread(r);
            t.setName("biz-scheduler-" + t.getId());
            t.setDaemon(false);
            t.setUncaughtExceptionHandler((thread, throwable) -> {
                logger.error("Uncaught exception in thread: {}", thread.getName(), throwable);
            });
            return t;
        });

        // 关键配置：取消时立即从队列移除
        exec.setRemoveOnCancelPolicy(true);
        // 关键配置：shutdown后不再执行延迟任务
        exec.setExecuteExistingDelayedTasksAfterShutdownPolicy(false);
        // 关键配置：shutdown后不再执行周期任务
        exec.setContinueExistingPeriodicTasksAfterShutdownPolicy(false);
    }

    public void start() {
        future = exec.scheduleWithFixedDelay(() -> {
            long start = System.nanoTime();
            try {
                // 执行实际任务（带超时控制）
                doWorkWithTimeout();
                successCount.incrementAndGet();
                recordSuccess();
            } catch (Throwable t) {
                // 必须捕获Throwable，防止周期任务静默停止
                failureCount.incrementAndGet();
                recordFailure(t);
                logger.error("Scheduled task failed, count: {}", failureCount.get(), t);
            } finally {
                long costMs = (System.nanoTime() - start) / 1_000_000;
                recordLatency(costMs);
            }
        }, 0, 2, TimeUnit.SECONDS);
    }

    public void stop() throws InterruptedException {
        if (future != null) {
            future.cancel(false);
        }
        exec.shutdown();
        if (!exec.awaitTermination(5, TimeUnit.SECONDS)) {
            logger.warn("Scheduler did not terminate in time, forcing shutdown");
            exec.shutdownNow();
        }
    }
    
    // 模拟方法（实际项目中应替换为真实实现）
    private void doWorkWithTimeout() throws Exception {
        // 实际业务逻辑
    }
    
    private void recordSuccess() {
        logger.info("Task succeeded, total success: {}", successCount.get());
    }
    
    private void recordFailure(Throwable t) {
        logger.error("Task failed, total failures: {}", failureCount.get());
    }
    
    private void recordLatency(long costMs) {
        logger.debug("Task latency: {}ms", costMs);
    }
}

ForkJoinPool详解：分治并行的执行引擎

java-thread-x-forkjoin-只发生在同层之间.png

前言：分治并行的诞生

ForkJoinPool 不是为了通用"并行"而设计，而是专门为分治并行（Divide-and-Conquer Parallelism）这一特定模式量身定制。分治算法（如快速排序、归并排序、树遍历）具有独特的执行模式：

任务天然形成树状结构
父任务派生子任务后需要等待结果
子任务之间通常无依赖关系
计算密集，无I/O阻塞

理解分治算法的执行特性，是理解 ForkJoinPool 设计的关键。传统线程池在处理这类任务时遇到根本性挑战，ForkJoinPool 正是为解决这些挑战而诞生。

核心数据结构：ForkJoinPool的基石

ForkJoinPool：去中心化的调度器

数据结构定义

public class ForkJoinPool extends AbstractExecutorService {
    // 64位控制状态：编码活跃线程数、空闲线程数、任务计数。这个地方编码和 TPE 不一样。
    volatile long ctl;
    
    // 工作队列数组：每个工作线程一个队列
    volatile WorkQueue[] workQueues; // 与TPE的关键区别：TPE用HashSet<Worker>直接持有线程引用，
                                     // 而FJP通过WorkQueue数组间接管理线程——每个WorkQueue关联一个ForkJoinWorkerThread，
                                     // 线程状态通过ctl字段的位操作管理，任务调度通过workQueues数组实现
    
    // 专用线程工厂
    final ForkJoinWorkerThreadFactory factory;
    
    // 未捕获异常处理器
    final UncaughtExceptionHandler ueh;
    
    // 配置参数
    final int config; // 低16位：并行度（parallelism）
    
    // 静态公共池
    static final ForkJoinPool commonPool();
}

与ThreadPoolExecutor的本质区别

// ThreadPoolExecutor的核心结构
public class ThreadPoolExecutor extends AbstractExecutorService {
    private final BlockingQueue<Runnable> workQueue; // 单一共享队列
    private final HashSet<Worker> workers;          // 持有所有工作线程引用，用于遍历查找特定状态线程（如中断空闲线程）及统计监控
    private volatile int corePoolSize;               // 核心线程数
    private volatile int maximumPoolSize;            // 最大线程数
}

// ForkJoinPool的核心结构
public class ForkJoinPool extends AbstractExecutorService {
    volatile WorkQueue[] workQueues;                // 工作队列数组，每个 ForkjoinWokerThread 持有一个 workQueue，这个池就持有一个 workQueue 数组
    volatile long ctl;                              // 64位状态控制
    // 无corePoolSize/maximumPoolSize概念
}

关键差异

队列模型：TPE使用单一共享队列，FJP使用每个线程私有队列
线程管理：TPE有明确的core/max参数，FJP只有目标并行度
调度策略：TPE基于生产者-消费者模型，FJP基于工作窃取模型

队列类型选择：阻塞队列 vs CAS 无锁队列

核心问题：为什么 TPE 用阻塞队列（BlockingQueue），而 FJP 用 CAS 实现的双端队列（WorkQueue）？

答案：取决于竞争烈度与等待语义的组合，需要在阻塞让出 CPU 与 CAS 自旋重试之间权衡。

竞争烈度的四象限分析

                    等待时间短（快速重试）         等待时间长（可能阻塞）
                    ──────────────────────────────────────────────────
高竞争烈度        │  CAS 自旋 = CPU 空转浪费    │  锁 + 条件变量 = 合理
（共享资源）      │  ❌ 不推荐                  │  ✅ TPE 的选择
──────────────────────────────────────────────────────────────────────
低竞争烈度        │  CAS 自旋 = 快速通过        │  锁 + 条件变量 = 过度设计
（私有资源）      │  ✅ FJP 的选择              │  不必要的上下文切换

关键洞察：

高竞争 + 长等待 → 必须阻塞，否则线程自旋浪费 CPU
低竞争 + 短等待 → CAS 更优，锁的上下文切换开销比 CAS 重试更贵

TPE vs FJP：竞争烈度对比

维度	TPE（生产者-消费者）	FJP（工作窃取）
队列模型	N 线程竞争 1 个共享队列	N 线程各有私有队列，偶尔窃取
竞争烈度	高（所有线程抢同一把锁）	低（99% 操作自己队列，无竞争）
等待时长	长（任务不足时可能无限等待）	短（窃取失败立即换目标）
等待语义	必须等待任务到达	窃取失败可以放弃
方案选择	锁 + 条件变量（让等待者睡眠）	CAS 无锁（快速尝试）
开销对比	锁开销 ~100-200 CPU 周期	CAS ~50 CPU 周期

为什么 TPE 必须用阻塞队列？

假设 8 核机器，8 个线程，任务不足时：

CAS 方案：8 个线程都在自旋，CPU 使用率 800%，但没有任何有用工作
阻塞方案：所有线程 wait() 睡眠，让出 CPU 给其他进程

为什么 FJP 可以用 CAS？

99% 时间操作自己队列，无竞争
窃取是低频操作（1%），失败立即换目标，不需要"等待"
窃取失败不意味着业务错误，可以放弃

通用设计原则

竞争烈度	等待语义	推荐方案	典型场景
高（N 线程竞争 1 资源）	长等待（等待资源可用）	锁 + 条件变量	TPE 共享队列、生产者-消费者
高（N 线程竞争 1 资源）	短等待（快速操作）	自旋锁/乐观锁	短临界区、读多写少
低（N 线程各有资源）	无等待（失败即走）	CAS 无锁	FJP 私有队列、工作窃取
低（N 线程各有资源）	需等待（等待条件）	每资源独立锁	分片锁、分段锁

什么是"等待"？为什么要等待？

等待的本质：线程无法继续执行，需要等待条件成立或资源可用。

关键区别：

维度	需等待（阻塞语义）	无等待（非阻塞语义）
操作是否必须成功	是，失败意味着业务错误	否，失败可以重试或放弃
失败后的选择	等待重试（阻塞）	立即重试或走人
典型语义	“我必须拿到这个资源”	“有机会就试试，没机会就算了”
实现机制	锁 + 条件变量	CAS

为什么"低竞争 + 需等待"选择"每资源独立锁"？

关键在于分片降低竞争。例如 ConcurrentHashMap：

全局锁：16 线程竞争同一把锁 → 高竞争
分段锁（16 segment）：竞争概率降至 1/16

决策树

操作是否必须成功（失败后能否放弃）？
├─ 否 → CAS 无锁（失败即走，如 FJP 窃取）
└─ 是 → 是否高竞争？
        ├─ 是 → 能否分片降低竞争？
        │       ├─ 能 → 每资源独立锁（如 ConcurrentHashMap 分段锁）
        │       └─ 否 → 锁 + 条件变量（如 TPE 共享队列）
        └─ 否 → 每资源独立锁（竞争本来就低）

一句话总结

竞争烈度决定机制选择：高竞争长等待必须阻塞（否则 CPU 空转），低竞争无等待应该 CAS（否则锁开销过大）。TPE 和 FJP 的队列选择，是这一原则的完美诠释。

ForkJoinWorkerThreadFactory：专用线程工厂

接口定义与对比

// 标准ThreadFactory接口
public interface ThreadFactory {
    /**
     * 创建新线程
     * @param r 线程要执行的Runnable
     * @return 新线程
     */
    Thread newThread(Runnable r);
}

// ForkJoinWorkerThreadFactory接口
public static interface ForkJoinWorkerThreadFactory {
    /**
     * 创建新的ForkJoinWorkerThread
     * @param pool 线程所属的ForkJoinPool
     * @return 新的工作线程
     */
    ForkJoinWorkerThread newThread(ForkJoinPool pool);
}

关键区别

完全不同的接口：两者没有继承关系，签名完全不同
上下文差异：标准工厂只接收Runnable，即任务，负责包装出线程；FJP工厂接收 ForkJoinPool 即线程池。
线程定制能力：线程工厂通常可以设置：
- 线程名称（便于调试）
- 线程优先级（Thread.setPriority()）
- 守护状态（Thread.setDaemon()）
- 上下文类加载器（Thread.setContextClassLoader()）
- 异常处理器（Thread.setUncaughtExceptionHandler()）
- 为什么在工厂里创建，传统工厂使用这个接口把任务包装成进程，并且启动：thread.start(); // 一旦 start()，大部分属性就无法修改了

FJP 的扩展方法

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.ForkJoinWorkerThread;
import java.util.concurrent.atomic.AtomicInteger;

public class CustomForkJoinWorkerThreadFactory 
    implements ForkJoinPool.ForkJoinWorkerThreadFactory {
    
    private final AtomicInteger threadNumber = new AtomicInteger(1);
    private final String poolName;
    private final int threadPriority;
    private final ClassLoader contextClassLoader;
    
    public CustomForkJoinWorkerThreadFactory(
        String poolName, 
        int threadPriority,
        ClassLoader contextClassLoader
    ) {
        this.poolName = poolName;
        this.threadPriority = threadPriority;
        this.contextClassLoader = contextClassLoader;
    }
    
    @Override
    public ForkJoinWorkerThread newThread(ForkJoinPool pool) {
        // 1. 使用默认工厂创建基础线程
        ForkJoinWorkerThread thread = ForkJoinPool.defaultForkJoinWorkerThreadFactory.newThread(pool);
        
        // 2. 自定义线程名称（便于调试）
        thread.setName(String.format("%s-worker-%d", poolName, threadNumber.getAndIncrement()));
        
        // 3. 设置线程优先级
        thread.setPriority(threadPriority);
        
        // 4. 设置上下文类加载器
        thread.setContextClassLoader(contextClassLoader);
        
        // 5. 设置未捕获异常处理器（线程级别的）
        thread.setUncaughtExceptionHandler((t, e) -> {
            System.err.printf("[%s] 线程 %s 发生未捕获异常: %s%n", 
                poolName, t.getName(), e.getMessage());
            e.printStackTrace();
        });
        
        // 6. 其他自定义设置
        thread.setDaemon(true); // 虽然ForkJoinPool会强制设置，但这里显式设置
        
        System.out.printf("创建工作线程: %s, 优先级: %d, 类加载器: %s%n",
            thread.getName(), thread.getPriority(), contextClassLoader.getClass().getSimpleName());
        
        return thread;
    }
}

设计意义

FJP的工作线程需要知道池的存在，才能参与工作窃取算法。标准ThreadFactory无法提供这种上下文，因此需要专用接口。

ForkJoinWorkerThread：协作式执行者

数据结构

public class ForkJoinWorkerThread extends Thread {
    // 所属线程池
    final ForkJoinPool pool;
    
    // 专属工作队列（由池在registerWorker时分配，而非构造函数直接创建）
    final WorkQueue workQueue;
    
    // 构造函数（简化示意）
    protected ForkJoinWorkerThread(ForkJoinPool pool) {
        this.pool = pool;
        // 注意：WorkQueue 不是在这里直接 new 出来的
        // 实际流程是调用 pool.registerWorker(this)，由池统一分配队列
        // 这确保了 WorkQueue 在 workQueues 数组中的索引由池统一管理
        this.workQueue = pool.registerWorker(this);
    }
}

与ThreadPoolExecutor.Worker的对比

// ThreadPoolExecutor.Worker（组合模式）
private final class Worker extends AbstractQueuedSynchronizer implements Runnable {
    final Thread thread;       // 通过组合持有Thread
    Runnable firstTask;        // 初始任务。任务和执行线程解耦，是兄弟成员。这个成员只使用一次，就在 addWorker 的时候减少对拥塞队列的锁竞争
    volatile long completedTasks; // 完成任务数
}

// ForkJoinWorkerThread（继承模式）
public class ForkJoinWorkerThread extends Thread {
    final ForkJoinPool pool;   // 直接持有池引用
    final WorkQueue workQueue; // 专属队列
}

Worker：“可以自锁定的 runnable，初始化是把自己装进 Thread 里，run 是在线程里循环阻塞获取拥塞队列里的任务-在 runWorker 里getTask”。
ForkJoinWorkerThread：“具有自主窃取能力的协作线程，run 是在本地队列空闲时主动扫描并窃取其他工作队列任务的群体智能执行器”。

设计决策

Worker使用组合：TPE的工作线程只需执行任务，无需特殊行为
FJP使用继承：需要重写run()实现工作窃取，且需要池上下文。继承意味着可以直接使用线程的生命周期方法。

线程安全特性：为什么ForkJoinPool不会有线程泄露问题？

ForkJoinPool 在线程管理上具有两个关键特性，使其天然避免了线程泄露问题：

1. 所有工作线程都是 Daemon 线程

// ForkJoinPool.registerWorker() 源码片段
final WorkQueue registerWorker(ForkJoinWorkerThread wt) {
    wt.setDaemon(true);  // 强制设置为守护线程
    // 正确
}

这意味着：

即使忘记调用 shutdown()，ForkJoinPool 的线程也不会阻止 JVM 退出
当所有非 daemon 线程结束时，JVM 会自动终止，daemon 线程随之销毁
与 ThreadPoolExecutor 的关键区别：TPE 默认创建非 daemon 线程，忘记关闭会导致 JVM 无法退出

2. 线程回收与资源管理

根据 Javadoc 文档：

“Using the common pool normally reduces resource usage (its threads are slowly reclaimed during periods of non-use, and reinstated upon subsequent use).”

线程回收机制：

空闲线程不会立即销毁，而是先 park() 等待
空闲时间超过阈值（约60秒）后，线程主动退出 run() 循环
下次需要时重新创建，避免永久空闲线程占用资源

不关闭时的资源状态：

Worker线程在运行/空闲期间持有FJP引用，实例暂时无法被GC回收
所有Worker退出后，FJP实例可被GC回收

显式关闭的优势：

shutdown()后已提交任务执行完成即关闭，无需等待空闲超时
shutdownNow()立即中断正在执行的任务并返回未执行任务列表

结论：daemon线程确保JVM可正常退出，但显式关闭仍是良好实践，可及时释放资源。

WorkQueue：双端队列的实现

数据结构

static final class WorkQueue {
    volatile int base;          // 队列头部索引（公开，供窃取）
    volatile int top;           // 队列尾部索引（虽主要由owner修改，但需volatile保证可见性）
    ForkJoinTask<?>[] array;    // 任务数组（环形缓冲区）
    final ForkJoinPool pool;    // 所属池
    final ForkJoinWorkerThread owner; // 所属线程（外部提交队列的owner为null）
}

术语定义：

base = 队头（低索引端，存放最早入队的任务）
top = 队尾（高索引端，存放最新入队的任务）

数组布局：
base → [T1] [T2] [T3] [T4] [T5] ← top
        ↑                       ↑
      队头                    队尾
    (最早任务)              (最新任务)

工作窃取（Work-Stealing）机制详解

工作窃取是双端队列的两端分离操作：owner 线程操作队尾（push 时 top++），stealer 线程操作队头（steal 时 base++），两端各自单向移动，通过 CAS 仲裁竞争，实现无锁化负载均衡。

asyncMode 决定 owner 取任务方向：

LIFO 模式（默认）：从队尾 pop（top--），与 stealer 两端分离，无竞争
FIFO 模式：从队头 poll（base++），与 stealer 同端操作，需 CAS 竞争。Executors.newWorkStealingPool() 默认此模式，竞争开销高于 LIFO。

graph TB
    subgraph "ForkJoinPool 工作窃取示意图"
        direction TB
        
        subgraph "Worker Thread 1 (繁忙)"
            W1[Worker 1<br/>正在执行 Task A]
            W1Q["WorkQueue 1 (双端队列)<br/>━━━━━━━━━━━━━━━━━━━━<br/>base → [T1][T2][T3][T4][T5] ← top<br/>━━━━━━━━━━━━━━━━━━━━"]
            W1 -.->|"push/pop<br/>(LIFO 模式)"| W1Q
        end
        
        subgraph "Worker Thread 2 (空闲)"
            W2[Worker 2<br/>队列已空]
            W2Q["WorkQueue 2 (双端队列)<br/>━━━━━━━━━━━━━━━━━━━━<br/>base → [ ] ← top<br/>━━━━━━━━━━━━━━━━━━━━<br/>(空队列)"]
            W2 -.->|"尝试 pop"| W2Q
        end
        
        subgraph "Worker Thread 3 (繁忙)"
            W3[Worker 3<br/>正在执行 Task B]
            W3Q["WorkQueue 3 (双端队列)<br/>━━━━━━━━━━━━━━━━━━━━<br/>base → [T6][T7][T8] ← top<br/>━━━━━━━━━━━━━━━━━━━━"]
            W3 -.->|"push/pop<br/>(LIFO 模式)"| W3Q
        end
        
        W2 ==>|"① 扫描其他队列"| W1Q
        W2 ==>|"② 从 base 端窃取 T1"| W1Q
        W1Q -.->|"③ 窃取成功<br/>T1 移至 Worker 2"| W2
        
        style W1 fill:#ffcdd2
        style W2 fill:#c8e6c9
        style W3 fill:#ffcdd2
        style W1Q fill:#fff3e0
        style W2Q fill:#e8f5e9
        style W3Q fill:#fff3e0
    end

工作模式与适用场景：

模式	Owner 操作	竞争情况	适用场景	优点	缺点
LIFO（默认）	队尾 push/pop	无竞争（两端分离）	递归分治、并行流、CompletableFuture	缓存局部性好、无锁化	不适用于 IO 阻塞
FIFO	队尾 push/队头 poll	同端 CAS 竞争	事件处理、消息消费	任务顺序公平	竞争开销略高

核心操作

// 本地push (LIFO)
final void push(ForkJoinTask<?> task) {
    ForkJoinTask<?>[] a = array;
    int s = top, cap = a.length;
    a[s & (cap - 1)] = task;  // 写入尾部
    top = s + 1;              // 仅本线程修改，无锁
}

// 本地pop (LIFO)
final ForkJoinTask<?> pop() {
    ForkJoinTask<?>[] a = array;
    int s = top, cap = a.length;
    if (s != base) {          // 队列非空
        ForkJoinTask<?> t = a[--s & (cap - 1)]; // 从尾部取
        a[s & (cap - 1)] = null;
        top = s;
        return t;
    }
    return null;
}

// 窃取poll (FIFO)
final ForkJoinTask<?> poll() {
    ForkJoinTask<?>[] a = array;
    int b = base, cap = a.length;
    if (b != top) {           // 队列非空
        int i = b & (cap - 1);
        ForkJoinTask<?> t = a[i];
        if (t != null && 
            base == b &&      // 检查base未变
            UNSAFE.compareAndSwapInt(this, BASE, b, b + 1)) { // CAS更新
            a[i] = null;
            return t;
        }
    }
    return null;
}

LIFO + FIFO 的设计智慧：

本地LIFO：最近派生的任务最先执行，保持时间局部性（temporal locality）：
- 时间局部性：最近访问的数据很可能再次被访问
- 在分治算法中，最近派生的任务通常与父任务共享数据
- 保持这些数据在CPU缓存中，避免缓存失效惩罚
窃取FIFO：最早派生的任务最先被窃取，保证窃取到"大块"任务
- "大块任务"解释：这不是编程隐喻，而是指计算量大的任务。在分治算法中：
  - 最早派生的任务通常是父任务分解的第一层子任务，包含大量工作
  - 最近派生的任务通常是深层子任务，计算量较小
- 例如快速排序中，根任务分解为左右子任务，这两个是"大块任务"；而叶子节点任务只处理几个元素，是"小块任务"
- 本地LIFO执行小任务（保持缓存），窃取FIFO获取大任务（避免任务碎片化）

ForkJoinTask.join() 与 Thread.join() 的本质差异

这是 ForkJoinPool 能够高效处理海量递归任务而不会死锁的关键机制。两种 join 有着根本性的不同。

Thread.join() - 阻塞式等待

Thread.join() 的核心机制是：在一个 synchronized 方法中，通过 while (isAlive()) 循环调用 wait()，让调用线程进入 WAITING 状态。当目标线程终止时，JVM 自动调用 notifyAll() 唤醒等待者。这是一种典型的操作系统级别的线程阻塞。

关于 Thread.join() 的完整源码解析、设计哲学（三个关键角色的分离、接力式等待的本质、Thread 对象的特殊性等），请参阅《Java 并发编程笔记》中的 join 章节。

当调用 Thread.join() 时：

调用线程进入 WAITING 状态（由 wait() 方法决定）
线程被操作系统挂起，完全停止执行
直到目标线程结束，JVM 调用 notifyAll() 唤醒等待的线程
这是操作系统级别的线程阻塞

ForkJoinTask.join() - 协作式等待

当调用 ForkJoinTask.join() 时：

工作线程不会进入 WAITING 状态
线程继续执行其他任务（work-stealing）
定期检查等待的任务是否完成
这是用户态的协作式调度

关键差异对比

特性	Thread.join()	ForkJoinTask.join()
线程状态	WAITING（阻塞）	RUNNABLE（继续工作）
CPU 利用率	降低（线程挂起）	保持（继续执行任务）
上下文切换	需要（操作系统调度）	不需要（用户态调度）
死锁风险	高（递归场景）	无（协作式调度）
适用场景	独立线程	分治递归任务

为什么 ForkJoinTask.join() 不会导致死锁

考虑这个递归场景：

class RecursiveSum extends RecursiveTask<Long> {
    protected Long compute() {
        if (size <= THRESHOLD) {
            return computeDirectly();
        }
        
        // 父任务等待子任务
        RecursiveSum left = new RecursiveSum(leftHalf);
        RecursiveSum right = new RecursiveSum(rightHalf);
        
        left.fork();   // 提交到队列
        right.fork();  // 提交到队列
        
        // 父任务调用 join() 等待子任务
        return left.join() + right.join();
    }
}

如果使用 Thread.join()，这种模式会导致问题：

父线程阻塞等待子线程
但子任务可能还在队列中等待执行
如果所有线程都在等待，就会死锁

使用 ForkJoinTask.join()，不会死锁：

父任务调用 join() 时，工作线程不会阻塞
工作线程会尝试执行等待的子任务
如果子任务在自己的队列中，直接执行
如果子任务在其他队列中，窃取其他任务继续工作
这样父子任务永远不会相互阻塞

实现原理：详见后文协作式等待的源码实现章节。

总结

ForkJoinTask.join() 的协作式等待机制是 ForkJoinPool 的核心优势：

避免线程阻塞：工作线程永远不会因为等待而停止工作
充分利用 CPU：等待期间继续执行其他任务
避免死锁：父子任务可以在同一个线程中执行
支持海量任务：可以提交远超线程数的任务而不会耗尽资源

这种设计使得 ForkJoinPool 特别适合处理递归分治问题，如归并排序、快速排序、并行流等场景。

ForkJoinTask：任务抽象

核心结构

public abstract class ForkJoinTask<V> implements Future<V>, Serializable {
    // 32位状态字段
    volatile int status;
    
    // 状态常量（JDK 8实际定义）
    static final int DONE_MASK   = 0xf0000000; // 完成掩码
    static final int NORMAL      = 0xf0000000; // 正常完成（必须为负数）
    static final int CANCELLED   = 0xc0000000; // 已取消（必须小于NORMAL）
    static final int EXCEPTIONAL = 0x80000000; // 异常完成（必须小于CANCELLED）
    static final int SIGNAL      = 0x00010000; // 需要信号（必须 >= 1 << 16）
    static final int SMASK       = 0x0000ffff; // 短整型位用于标签
    // 注意：没有COMPLETING常量，COMPLETING是FutureTask的状态，不是ForkJoinTask的
    
    // 核心方法
    /**
     * 异步提交当前任务到当前线程的本地队列
     * @return this，支持链式调用
     */
    public final ForkJoinTask<V> fork();  // 异步提交
    
    /**
     * 等待当前任务完成并返回结果
     * 与 Thread.join()的关键区别：
     * - Thread.join()会阻塞当前线程，不做任何有用工作
     * - ForkJoinTask.join()会：
     *   1. 检查任务是否已完成
     *   2. 如果未完成，当前线程不会阻塞
     *   3. 而是执行"协作式等待"：
     *      a. 扫描其他工作队列窃取任务
     *      b. 如果窃取到的任务是目标任务的子任务，直接帮助执行
     *      c. 通过帮助执行，加速目标任务的完成
     *   4. 仅当全局无任务可做时才真正阻塞
     * - 可以从外部调用，但通常在FJ任务内部调用
     */
    public final V join();               // 等待完成
    
    /**
     * 任务的核心计算逻辑，由子类实现
     * 与join()的区别：
     * - compute()包含任务的实际执行逻辑
     * - join()是等待其他任务完成的方法
     * - compute()在当前线程执行，join()触发协作执行
     */
    public abstract V compute();        // 子类实现
    
    /**
     * 获取原始结果（由compute()设置）
     * 满足Future<V>接口契约
     */
    protected abstract V getRawResult();
    
    /**
     * 设置原始结果
     * 通常由compute()内部调用
     */
    protected abstract void setRawResult(V value);
    
    /**
     * 尝试从当前线程的队列中移除任务
     * 用于任务取消
     */
    public boolean tryUnfork();
}

标准子类

// 无返回值任务
public abstract class RecursiveAction extends ForkJoinTask<Void> {

    /**
     * 无返回值的计算逻辑
     * JLS允许将Void作为类型参数，虽然Void不可实例化
     * Void是不可实例化的占位符类型
     */
    protected abstract void compute();
    
    /**
     * 为什么需要这个方法？
     * - 满足ForkJoinTask<Void>的接口契约
     * - 虽然返回Void，但类型系统需要具体实现
     * - 比RecursiveTask更轻量，因为不需要处理返回值
     * - 保持API一致性，避免特殊处理
     */
    public final Void getRawResult() { return null; }
    protected final void setRawResult(Void mustBeNull) { }
}

// 有返回值任务
public abstract class RecursiveTask<V> extends ForkJoinTask<V> {
    V result; // 存储计算结果
    
    protected abstract V compute(); // 唯一需要子类实现的抽象方法
    
    // 注意：以下方法是final的，不是abstract的
    public final V getRawResult() { return result; }
    protected final void setRawResult(V value) { result = value; }
}

分治并行的编程模型简化

ForkJoinPool 将分治并行的复杂度封装在框架内部，开发者只需关注业务逻辑层面：

// 开发者的核心职责：实现 compute() 方法
protected V compute() {
    if (任务足够小) {
        return 直接计算();
    }
    // 分解：创建子任务
    MyTask left = new MyTask(左半部分);
    MyTask right = new MyTask(右半部分);
    
    // 派发：fork 子任务到工作队列
    left.fork();
    right.fork();
    
    // 合并：等待子任务结果并合并
    return combine(left.join(), right.join());
}

框架自动处理的复杂度：

开发者负责	框架负责
任务分解逻辑	任务调度与分发
`fork()` 派发子任务	工作窃取负载均衡
`join()` 获取结果	线程协作式等待（非阻塞）
`compute()` 合并结果	任务队列管理、缓存局部性优化

这种设计体现了关注点分离：开发者专注于分治算法的业务逻辑（如何分解、如何合并），框架负责底层并行执行的复杂性（何时调度、如何均衡）。这也是 Doug Lea 论文中强调的核心价值——让并行编程变得便捷。

与FutureTask的关键区别

// FutureTask.get()：可能完全阻塞
public V get() throws InterruptedException, ExecutionException {
    int s = state;
    if (s <= COMPLETING)
        // s 的最终赋值是等待完成的结果
        s = awaitDone(false, 0L); // 可能阻塞
    // 最终 s 决定了 report 的行为
    return report(s);
}

// ForkJoinTask.join()：协作式等待
public final V join() {
    if (doJoin() != NORMAL)       // doJoin()包含帮助执行逻辑
        throw new RuntimeException();
    return getRawResult();
}

关键API：与ThreadPoolExecutor的差异

ForkJoinPool的核心API

外部客户端API

// 重写的Executor.execute方法
@Override
public void execute(Runnable task) {
    // 将Runnable包装为ForkJoinTask
    ForkJoinTask<?> job = new TaskAdaptor(task);
    externalPush(job); // 提交到外部队列
}

// 针对ForkJoinTask的专用方法
/**
 * 为什么需要这个重载？
 * - 针对ForkJoinTask优化：避免包装开销
 * - 直接调用externalPush，性能更好
 * - 与父类的execute(Runnable)不是相互嵌套关系
 * - 两个方法针对不同类型的任务优化
 */
void execute(ForkJoinTask<?> task);

// 同步执行并返回结果
<T> T invoke(ForkJoinTask<T> task);

// 提交任务并返回Future
<T> ForkJoinTask<T> submit(ForkJoinTask<T> task);

对 TPE：execute(Runnable)是调度层的核心，不是最底层。最底层是 runWorker()。
对于外部提交，externalPush()或externalSubmit()是入口；但内部fork()调用的是WorkQueue.push()，两者是并行的入口路径，不是汇聚关系。

内部计算API

/**
 * 内部API的访问控制：
 * - 虽然fork()/join()是public方法，但文档约定只在FJ任务内部调用
 * - 通过文档约定和性能惩罚来限制，不是通过访问控制
 * - 在外部调用fork()会回退到commonPool，性能较差
 * - 正确用法：外部客户端用invoke()，内部计算用fork()/join()
 */
void ForkJoinTask.fork();    // 异步派生子任务
V ForkJoinTask.join();       // 等待子任务完成
V ForkJoinTask.invoke();     // 执行并等待完成

监控与管理API

// 获取全局窃取次数
long getStealCount();

// 等待池变为空闲
boolean awaitQuiescence(long timeout, TimeUnit unit);

// 优雅关闭
void shutdown();

ForkJoinPool 与 AbstractExecutorService 的关系辨析

关键问题：submit 和 execute 的关系是否改变了？

答案：接口契约未变，但实现路径不同。

根据 JSR-166 规范和 ForkJoinPool 的 Javadoc，需要区分两种情况：

情况1：普通 Runnable/Callable 任务

对于普通 Runnable/Callable，ForkJoinPool 完全遵循 AbstractExecutorService 的契约：

// AbstractExecutorService 的默认实现（ForkJoinPool 继承）
public Future<?> submit(Runnable task) {
    if (task == null) throw new NullPointerException();
    RunnableFuture<Void> ftask = newTaskFor(task, null);
    execute(ftask);  // 调用 ForkJoinPool.execute()
    return ftask;
}

// ForkJoinPool.execute() 的实现
@Override
public void execute(Runnable task) {
    if (task == null) throw new NullPointerException();
    ForkJoinTask<?> job;
    if (task instanceof ForkJoinTask)  // 不会进入此分支
        job = (ForkJoinTask<?>) task;
    else
        job = newTaskAdaptor(task);  // 包装为 ForkJoinTask
    externalPush(job);  // 提交到外部队列
}

调用链：submit() → newTaskFor() → execute() → externalPush() → WorkQueue

情况2：ForkJoinTask 任务

对于 ForkJoinTask，ForkJoinPool 提供了重载方法，绕过 FutureTask 包装：

// ForkJoinPool 专用方法
public <T> ForkJoinTask<T> submit(ForkJoinTask<T> task) {
    if (task == null) throw new NullPointerException();
    externalPush(task);  // 直接提交，不包装为 FutureTask
    return task;
}

public void execute(ForkJoinTask<?> task) {
    if (task == null) throw new NullPointerException();
    externalPush(task);  // 直接提交，不包装为 FutureTask
}

调用链：submit() → externalPush() → WorkQueue（跳过 FutureTask 包装）

对比图示

graph TB
    subgraph "ThreadPoolExecutor（标准实现）"
        A1[submit Runnable] --> B1[newTaskFor]
        B1 --> C1[FutureTask]
        C1 --> D1[execute]
        D1 --> E1[WorkerQueue]
        
        A2[submit Callable] --> B2[newTaskFor]
        B2 --> C2[FutureTask]
        C2 --> D1
    end
    
    subgraph "ForkJoinPool（普通任务）"
        A3[submit Runnable] --> B3[newTaskFor]
        B3 --> C3[FutureTask]
        C3 --> D3[execute]
        D3 --> E3[externalPush]
        E3 --> F3[WorkQueue]
        
        A4[submit Callable] --> B4[newTaskFor]
        B4 --> C4[FutureTask]
        C4 --> D3
    end
    
    subgraph "ForkJoinPool（ForkJoinTask）"
        A5[submit ForkJoinTask] --> D5[externalPush]
        D5 --> F5[WorkQueue]
        
        A6[execute ForkJoinTask] --> D5
    end
    
    style A5 fill:#90EE90
    style A6 fill:#90EE90
    style D5 fill:#90EE90
    style F5 fill:#90EE90

关键结论

接口契约未变：ForkJoinPool 仍然继承 AbstractExecutorService，submit()、invokeAll()、invokeAny() 的契约保持不变
实现路径不同：
- 普通任务：submit() → FutureTask → execute() → externalPush() → WorkQueue
- ForkJoinTask：submit() → externalPush() → WorkQueue（跳过 FutureTask）
性能优化：ForkJoinTask 重载方法避免了不必要的 FutureTask 包装开销
工作窃取：无论哪种路径，最终都通过 externalPush() 提交到 WorkQueue，支持工作窃取算法

这个设计体现了 ForkJoinPool 的双重性质：既要兼容 ExecutorService 标准接口，又要为 ForkJoinTask 提供优化路径。

API 主次之分：与 ScheduledThreadPoolExecutor 类似，ForkJoinPool 的传统 execute/submit/invokeAll/invokeAny 是"外部客户端 API"，用于从非 fork/join 上下文提交任务。真正体现 ForkJoinPool 分治并行能力的核心 API 是 ForkJoinPool.invoke(ForkJoinTask) 和 ForkJoinTask.fork()/join()——前者是外部提交根任务的入口，后者是任务内部分解和合并的机制。在 fork/join 计算内部混用外部 API 会导致绕过工作窃取优化，详见 API使用边界章节。

API使用边界：为什么不能混用？

Javadoc 明确划分了 API 使用边界：

meannings	Call from non-fork/join clients	Call from within fork/join computations
Arrange async execution	`execute(ForkJoinTask)`	`ForkJoinTask.fork()`
Await and obtain result	`invoke(ForkJoinTask)`	`ForkJoinTask.invoke()`
Arrange exec and obtain Future	`submit(ForkJoinTask)`	`ForkJoinTask.fork()` (ForkJoinTasks are Futures)

"Arrange"的含义：
此处的"Arrange"是英语动词，意为"安排、组织"，描述API的意图：

Arrange async execution = “安排异步执行” → 任务提交后立即返回
Await and obtain result = “等待并获取结果” → 阻塞直到任务完成
Arrange exec and obtain Future = “安排执行并获取 Future” → 异步执行但保留结果句柄，通过 Future 获取结果。

原始文档强调2： “These methods are designed to be used primarily by clients
not already engaged in fork/join computations in the current pool…
tasks that are already executing in a pool should normally instead use
the within-computation forms…”

混用API的代价：

性能下降：绕过工作窃取优化
死锁风险：阻塞式等待导致资源浪费
缓存失效：失去任务局部性

线程调度机制：动态适应的艺术

并行度：唯一的核心参数

配置参数

// 构造函数
public ForkJoinPool(int parallelism,
                   ForkJoinWorkerThreadFactory factory,
                   UncaughtExceptionHandler handler,
                   boolean asyncMode);

四个参数详解：

parallelism：目标并行度
- 控制池中活跃工作线程的数量上限
- 默认值为Runtime.getRuntime().availableProcessors()
- 实际线程数会根据负载动态调整
factory：工作线程工厂
- 用于创建ForkJoinWorkerThread实例
- 默认使用ForkJoinPool.defaultForkJoinWorkerThreadFactory
- 可自定义线程名称、优先级、上下文类加载器等属性
handler：未捕获异常处理器
- 处理工作线程中未被捕获的异常
- 默认为null，异常会传播到ThreadGroup.uncaughtException()
- 可设置自定义处理器进行统一异常处理
asyncMode：任务调度模式（核心设计决策）
- false（默认）：LIFO模式 - 本地队列采用后进先出
  - 适合递归分解任务（divide-and-conquer）
  - 增强任务局部性，提高缓存命中率
  - Owner 从队尾取，Stealer 从队头窃取，两端分离无竞争
- true：FIFO模式 - 本地队列采用先进先出
  - 适合事件驱动任务（event-style tasks）
  - 任务按顺序公平分发
  - Owner 和 Stealer 都从队头取，同端 CAS 竞争

设计哲学与JRE源码的深层考量：

表面上看，newWorkStealingPool()设置asyncMode=true似乎与"递归分解适合LIFO"的原则相矛盾。但实际上这是精心设计的结果：

使用场景区分：
- 直接使用ForkJoinPool构造函数：通常是开发者明确知道在做分治算法
- 使用newWorkStealingPool()：面向通用并发任务，多数是非递归的独立任务

性能优化考量：

asyncMode=true的优势：
→ 任务按提交顺序执行，减少线程竞争
→ 适合大量独立小任务的并发执行
→ 避免递归深度导致的栈溢出风险
→ 更好的负载均衡效果

API设计意图：
- newWorkStealingPool()旨在提供"开箱即用"的高性能并发池
- 默认FIFO模式对大多数应用更友好
- 需要专门的分治算法时，开发者会直接使用ForkJoinPool构造函数

Doug Lea的设计智慧：

// JDK源码中的实际设计
public static ExecutorService newWorkStealingPool(int parallelism) {
    return new ForkJoinPool(parallelism, 
                           defaultForkJoinWorkerThreadFactory,
                           null, true);  // 故意设为true
}

这种设计体现了"默认最优"的理念：为普通用户提供最适合大多数场景的配置，而将专业调优留给有明确需求的开发者。

关于工作窃取算法的澄清（回应读者核心疑问）：

这是一个非常重要的概念澄清：

正确 工作窃取算法始终启用：

无论是asyncMode=true还是false，工作窃取机制都100%启用
这是ForkJoinPool的核心特性，不因asyncMode而改变
Doug Lea设计的work-stealing算法是ForkJoinPool存在的根本

错误 常见的误解纠正：

graph TD
    A[ForkJoinPool核心机制] --> B[工作窃取算法<br/>始终启用]
    A --> C[任务调度策略<br/>受asyncMode影响]
    B --> D[线程空闲时<br/>从其他线程队列窃取任务]
    C --> E[asyncMode=false: LIFO本地队列]
    C --> F[asyncMode=true: FIFO本地队列]
    E --> G[适合递归分解<br/>增强局部性]
    F --> H[适合独立任务<br/>减少竞争]

递归分解 vs 工作窃取的关系：

这两个特性不是互斥的，而是互补的：

工作窃取是基础设施：提供线程间的负载均衡能力
任务调度策略是优化手段：针对不同类型任务优化性能

asyncMode=false（LIFO）：
- 本地执行：LIFO（最新任务优先）
- 窃取机制：从队头窃取
- 优势：递归任务局部性好，缓存友好

asyncMode=true（FIFO）：
- 本地执行：FIFO（按序执行）
- 窃取机制：从队头窃取
- 优势：独立任务公平分发

要点：

工作窃取 ≠ 任务调度策略
工作窃取是"怎么分任务"，调度策略是"按什么顺序执行任务"
newWorkStealingPool()名称强调的是"使用工作窃取算法的池"，而非"积极启用工作窃取"
asyncMode=true实际上是选择了更适合通用任务的执行顺序，但工作窃取机制从未关闭

公共池的系统属性

java.util.concurrent.ForkJoinPool.common.parallelism
    - 目标并行度，控制活跃线程数
    - 默认 = Runtime.getRuntime().availableProcessors()
    
java.util.concurrent.ForkJoinPool.common.threadFactory
    - 自定义工作线程创建逻辑
    - 默认使用DefaultForkJoinWorkerThreadFactory
    
java.util.concurrent.ForkJoinPool.common.exceptionHandler
    - 处理未捕获异常
    - 默认使用系统默认异常处理器：
    //   - 打印异常堆栈到System.err
    //   - 不终止JVM
    //   - 可通过Thread.setDefaultUncaughtExceptionHandler覆盖
    
java.util.concurrent.ForkJoinPool.common.maximumSpares
    - 额外线程上限，用于补偿阻塞
    - 默认 = 256

构造器参数的实际影响：

parallelism：直接影响CPU利用率，设置过大导致上下文切换开销
threadFactory：可控制线程优先级、名称、守护状态
exceptionHandler：确保异常不会静默失败

系统属性配置（非构造器参数）：

maximumSpares：处理阻塞时的补偿线程上限，通过系统属性 java.util.concurrent.ForkJoinPool.common.maximumSpares 配置，默认 256

无core/max参数的设计哲学

ThreadPoolExecutor的线程管理

// TPE的线程创建逻辑
if (当前线程数 < corePoolSize) 创建核心线程
else if (队列未满) 入队
else if (当前线程数 < maximumPoolSize) 创建非核心线程
else 拒绝策略

ForkJoinPool的线程管理

// FJP的线程创建逻辑
if (活跃线程数 < parallelism) 创建新线程
else if (有线程阻塞且 spare线程数 < maximumSpares) 创建spare线程
else 复用现有线程 // 任务数超过线程数时：
                 //   - 通过工作窃取实现负载均衡
                 //   - 空闲线程会窃取其他队列的任务
                 //   - 如果没有空闲线程：
                 //     * 新任务入队到当前线程的本地队列
                 //     * 队列会动态扩容（无界）
                 //   - 不会创建新线程，除非有阻塞

parallelism vs corePoolSize, maximumSpares vs maximumPoolSize：

本质不同：
- TPE：corePoolSize是静态下限（保持的最小线程数），maximumPoolSize是静态上限（允许的最大线程数）
- FJP：parallelism是动态目标（期望的活跃线程数），maximumSpares是补偿上限（允许的额外线程数）：只要有任务，机制可以通过一个有限度的补偿拼命维持 active thread 的 count；ThreadPoolExecutor维持的是线程数量的边界范围（corePoolSize ≤ 线程数 ≤ maximumPoolSize），而不是特别关注线程的活跃状态。
- TPE的线程边界是硬性的，FJP的线程边界是软性的
- TPE创建线程是为了处理更多任务，FJP创建spare线程是为了补偿阻塞
关键区别：
- 线程数硬性上限：FJP的线程数永远不会超过 parallelism + maximumSpares
- 当达到上限后：
  - 有线程阻塞时，无法创建spare线程
  - 新任务入队到现有线程的队列（队列无界，会动态扩容）
- 与TPE的核心区别：
  - TPE：有界队列满 + 线程=max 时触发拒绝策略（RejectedExecutionHandler）
  - FJP：无需配置拒绝策略，队列动态扩容，仅在 shutdown 或内部资源耗尽时抛出 RejectedExecutionException

线程回收机制对比

Javadoc明确说明 2： “Using the common pool normally reduces resource
usage (its threads are slowly reclaimed during periods of non-use, and
reinstated upon subsequent use).”

FJP线程回收细节

空闲线程不会立即销毁，而是park()
如果空闲时间超过阈值，标记为可回收
通过ctl字段的位操作，逐步减少活跃线程计数
下次需要时重新创建，避免频繁创建/销毁开销

为什么没有拒绝策略：无界队列与任务消费模型

ForkJoinPool 构造器对比

查看 ForkJoinPool 的构造器签名，会发现一个显著的差异：

// ThreadPoolExecutor 构造器（7个参数）
public ThreadPoolExecutor(
    int corePoolSize,
    int maximumPoolSize,
    long keepAliveTime,
    TimeUnit unit,
    BlockingQueue<Runnable> workQueue,
    ThreadFactory threadFactory,
    RejectedExecutionHandler handler  // 拒绝策略
)

// ForkJoinPool 构造器（最完整版本，4个参数）
public ForkJoinPool(
    int parallelism,
    ForkJoinWorkerThreadFactory factory,
    UncaughtExceptionHandler handler,  // 异常处理器，不是拒绝策略
    boolean asyncMode
)

ForkJoinPool 没有 RejectedExecutionHandler 参数。这不是疏忽，而是有意为之的设计决策。

为什么不需要拒绝策略？

flowchart TB
    subgraph TPE["ThreadPoolExecutor 任务流"]
        T1[新任务] --> T2{线程数 < core?}
        T2 -->|是| T3[创建核心线程]
        T2 -->|否| T4{队列未满?}
        T4 -->|是| T5[入队等待]
        T4 -->|否| T6{线程数 < max?}
        T6 -->|是| T7[创建非核心线程]
        T6 -->|否| T8[触发拒绝策略]
        
        style T8 fill:#ff6b6b,color:#fff
    end
    
    subgraph FJP["ForkJoinPool 任务流"]
        F1[新任务] --> F2{外部提交?}
        F2 -->|是| F3[放入共享提交队列]
        F2 -->|否| F4[放入当前线程本地队列]
        F3 --> F5[队列动态扩容]
        F4 --> F5
        F5 --> F6[工作窃取平衡负载]
        F6 --> F7[join时帮助执行]
        
        style F5 fill:#51cf66,color:#fff
        style F7 fill:#51cf66,color:#fff
    end

原因一：队列是无界的

每个 WorkQueue 内部使用 ForkJoinTask<?>[] array 存储任务：

根据 ForkJoinPool 的 Javadoc（Java SE 8+）：

“This implementation rejects submitted tasks (that is, by throwing RejectedExecutionException) only when the pool is shut down or internal resources have been exhausted.”

这意味着 ForkJoinPool 不需要显式的拒绝策略参数，因为：

正常运行时，任务总能被接受（队列会动态扩容）
只有在 shutdown 或内部资源耗尽时才会拒绝

// WorkQueue 内部结构（来自 OpenJDK 8 源码）
static final class WorkQueue {
    ForkJoinTask<?>[] array;  // 任务数组
    int base;                  // 窃取端索引（FIFO）
    int top;                   // 本地端索引（LIFO）
    // 正确
    
    // 数组容量范围（来自 OpenJDK 源码）
    static final int INITIAL_QUEUE_CAPACITY = 1 << 13;  // 8192
    static final int MAXIMUM_QUEUE_CAPACITY = 1 << 26;  // 67,108,864（约 6700 万）
}

当队列满时，会自动扩容（容量翻倍），直到达到 MAXIMUM_QUEUE_CAPACITY。这意味着：

单个队列理论上可以容纳约 6700 万个任务
多个工作线程各有自己的队列
实际上，内存耗尽（OOM）会先于队列容量上限触发 “internal resources exhausted”

原因二：任务模型的本质差异

ThreadPoolExecutor 处理的是独立任务：

任务之间没有依赖关系
拒绝一个任务不影响其他任务
拒绝策略是合理的边界保护

ForkJoinPool 处理的是可分解的递归任务：

父任务 fork 出子任务
父任务必须 join 等待子任务完成
如果拒绝子任务，父任务将永远无法完成，导致死锁

// 如果 ForkJoinPool 有拒绝策略，这段代码可能死锁
protected Integer compute() {
    if (size < THRESHOLD) {
        return directCompute();
    }
    
    SubTask left = new SubTask(leftHalf);
    SubTask right = new SubTask(rightHalf);
    
    left.fork();   // 如果这里被拒绝...
    right.fork();  // 或者这里被拒绝...
    
    // 父任务将永远阻塞在这里
    return left.join() + right.join();
}

原因三：join 的协作式消费

ForkJoinPool 的 join 不是被动等待，而是主动帮助消费任务：

sequenceDiagram
    participant Parent as 父任务线程
    participant Queue as 本地队列
    participant Child as 子任务
    
    Parent->>Queue: fork(子任务)
    Parent->>Parent: 准备 join
    
    alt 子任务还在本地队列顶部
        Parent->>Queue: tryUnpush(子任务)
        Parent->>Child: 直接执行子任务
        Child-->>Parent: 返回结果
    else 子任务被窃取
        Parent->>Queue: 执行队列中其他任务
        Note over Parent: 帮助消费，而非空等
        Child-->>Parent: 异步完成后返回结果
    end

这种设计意味着：

即使队列中有大量任务，线程也在持续消费
join 操作本身就是在帮助消费队列
任务的生产和消费是协作式的，不会出现"生产远超消费"的失控情况

队列无界会导致 OOM 吗？

理论上是的，但在正确使用 ForkJoinPool 的场景下，这不是问题：

分治任务的"菱形"特征：

graph TD
    subgraph "任务数量随时间变化"
        A[根任务] --> B1[子任务1]
        A --> B2[子任务2]
        B1 --> C1[孙任务1]
        B1 --> C2[孙任务2]
        B2 --> C3[孙任务3]
        B2 --> C4[孙任务4]
        
        C1 --> D1[结果1]
        C2 --> D2[结果2]
        C3 --> D3[结果3]
        C4 --> D4[结果4]
        
        D1 --> E1[合并1]
        D2 --> E1
        D3 --> E2[合并2]
        D4 --> E2
        
        E1 --> F[最终结果]
        E2 --> F
    end
    
    style A fill:#4dabf7
    style B1 fill:#748ffc
    style B2 fill:#748ffc
    style C1 fill:#9775fa
    style C2 fill:#9775fa
    style C3 fill:#9775fa
    style C4 fill:#9775fa
    style D1 fill:#da77f2
    style D2 fill:#da77f2
    style D3 fill:#da77f2
    style D4 fill:#da77f2
    style E1 fill:#f783ac
    style E2 fill:#f783ac
    style F fill:#ff6b6b

典型的分治任务呈现"先增后减"的菱形模式：

分解阶段：任务数量指数增长
基准情况：到达阈值，开始直接计算
合并阶段：任务数量指数减少

工作窃取算法确保任务被及时消费，队列长度不会无限增长。

如果滥用会怎样？

如果把 ForkJoinPool 当作普通线程池，不断提交独立任务而不消费结果：

// 错误用法：把 ForkJoinPool 当作无界队列使用
ForkJoinPool pool = ForkJoinPool.commonPool();
while (true) {
    pool.execute(() -> {
        // 永远不结束的任务，或者生产速度远超消费速度
        Thread.sleep(Long.MAX_VALUE);
    });
}
// 最终会 OOM

这与使用 new ThreadPoolExecutor(..., new LinkedBlockingQueue<>()) 的效果相同——都会因为无界队列导致 OOM。

设计哲学总结

维度	ThreadPoolExecutor	ForkJoinPool
任务模型	独立任务	可分解的递归任务
队列类型	可配置（有界/无界）	动态扩容（无界）
拒绝策略	必需配置 RejectedExecutionHandler	无需配置，仅在 shutdown/资源耗尽时拒绝
消费模式	被动等待	协作式消费（join帮助执行）
适用场景	通用任务执行	分治并行计算
OOM风险	无界队列时存在	滥用时存在（触发 internal resources exhausted）

要点：ForkJoinPool 的构造器不需要 RejectedExecutionHandler 参数，是因为在分治并行模型中，拒绝子任务会导致父任务死锁。根据 Javadoc，ForkJoinPool 仅在 shutdown 或内部资源耗尽时抛出 RejectedExecutionException。动态扩容的队列配合工作窃取和协作式 join，形成了一个自平衡的任务消费系统。

工作线程生命周期

工作线程经历四个阶段：

初始化：首次提交任务时创建，初始活跃线程数不超过parallelism，但总线程数可能达到 parallelism + maximumSpares
- 与TPE的关键区别：TPE的核心线程即使空闲也不会回收（除非设置allowCoreThreadTimeOut），而FJP的所有线程在空闲时都会被回收
- FJP的设计哲学：按需创建，及时释放，适合间歇性负载
活跃期：执行任务 + 窃取任务，检测阻塞时触发spare线程
- 通过ManagedBlocker接口检测阻塞
- 当线程阻塞时，可能创建spare线程补偿
空闲期：无任务时park()，保持空闲状态
- 线程通过awaitWork()方法（内部实现）进入等待，使用LockSupport.park()挂起
- 有新任务时被唤醒
回收期：空闲超过阈值，逐步减少线程
- 通过ctl字段的位操作管理线程状态，空闲超时后线程主动退出run()循环
- 线程退出run()方法，被垃圾回收
- 下次需要时重新创建，避免永久空闲线程

根据 ForkJoinPool 源码注释和 Javadoc 文档：

“The pool attempts to maintain enough active (or available) threads by dynamically adding, suspending, or resuming internal worker threads, even if some tasks are stalled waiting to join others.”

这意味着 ForkJoinPool 会动态调整线程数以维持目标并行度，同时避免频繁的线程创建/销毁循环。与传统线程池不同，ForkJoinPool 会回收所有空闲线程以减少资源消耗。

实战案例：并行文件搜索系统

业务需求

搜索指定目录下的所有文件
查找包含特定关键词的文件
统计匹配行数
处理大型目录（10万+文件）
要求高效利用多核CPU

数据结构定义

/**
 * 文件搜索任务：递归遍历目录树
 * 使用RecursiveTask，因为需要返回匹配结果
 */
class FileSearchTask extends RecursiveTask<List<SearchResult>> {
    private static final int THRESHOLD = 100; // 子任务阈值
    private final Path directory;
    private final String keyword;
    
    FileSearchTask(Path directory, String keyword) {
        this.directory = directory;
        this.keyword = keyword;
    }
    
    @Override
    protected List<SearchResult> compute() {
        try {
            // 获取目录下的所有路径（文件和子目录）
            List<Path> paths = Files.list(directory)
                                   .collect(Collectors.toList());
            
            // 基本情况：小目录直接处理
            if (paths.size() <= THRESHOLD) {
                return searchDirectly(paths);
            }
            
            // 递归情况：分解为子任务
            List<FileSearchTask> subtasks = new ArrayList<>();
            List<Path> currentBatch = new ArrayList<>();
            
            for (Path path : paths) {
                currentBatch.add(path);
                // 每THRESHOLD个路径创建一个子任务
                if (currentBatch.size() >= THRESHOLD) {
                    subtasks.add(new FileSearchTask(createTempDir(currentBatch), keyword));
                    currentBatch = new ArrayList<>();
                }
            }
            
            // 处理剩余路径
            if (!currentBatch.isEmpty()) {
                subtasks.add(new FileSearchTask(createTempDir(currentBatch), keyword));
            }
            
            // 优化：fork其他任务，直接执行最后一个任务（减少调度开销）
            if (subtasks.size() > 1) {
                // 将最后一个任务留给自己执行，它不进入 fork
                // 因为 fork 是一次执行，compute 是另一次，计算并不一定是幂等的
                FileSearchTask lastTask = subtasks.remove(subtasks.size() - 1);
                
                // 异步fork其他任务
                for (FileSearchTask task : subtasks) {
                    task.fork(); // 正确：无锁本地队列push
                }
                
                // 同步执行最后一个任务
                List<SearchResult> results = lastTask.compute(); // 正确：保持缓存
                
                // 等待其他任务完成
                for (FileSearchTask task : subtasks) {
                    results.addAll(task.join()); // 正确：协作式等待
                }
                
                return results;
            } else {
                // 只有一个子任务，直接执行
                return subtasks.get(0).compute();
            }
        } catch (IOException e) {
            throw new UncheckedIOException(e);
        }
    }
    
    private List<SearchResult> searchDirectly(List<Path> paths) {
        List<SearchResult> results = new ArrayList<>();
        for (Path path : paths) {
            if (Files.isDirectory(path)) {
                try {
                    // 递归处理子目录
                    results.addAll(new FileSearchTask(path, keyword).compute());
                } catch (IOException e) {
                    // 忽略无法访问的目录
                }
            } else {
                // 处理文件
                try (BufferedReader reader = Files.newBufferedReader(path)) {
                    String line;
                    int lineNumber = 1;
                    while ((line = reader.readLine()) != null) {
                        if (line.contains(keyword)) {
                            results.add(new SearchResult(path, lineNumber, line));
                        }
                        lineNumber++;
                    }
                } catch (IOException e) {
                    // 忽略无法读取的文件
                }
            }
        }
        return results;
    }
    
    private Path createTempDir(List<Path> paths) throws IOException {
        // 创建临时目录的逻辑（简化）
        return Files.createTempDirectory("search_");
    }
}

/**
 * 搜索结果封装
 */
class SearchResult {
    private final Path filePath;
    private final int lineNumber;
    private final String lineContent;
    
    SearchResult(Path filePath, int lineNumber, String lineContent) {
        this.filePath = filePath;
        this.lineNumber = lineNumber;
        this.lineContent = lineContent;
    }
    
    @Override
    public String toString() {
        return String.format("%s:%d: %s", filePath, lineNumber, lineContent);
    }
}

线程池初始化与使用

public class ParallelFileSearch {
    
    /**
     * 创建自定义ForkJoinPool
     * 根据业务需求配置参数
     */
    private static ForkJoinPool createSearchPool() {
        int parallelism = Math.min(
            Runtime.getRuntime().availableProcessors(),
            16 // 限制最大并行度，避免I/O瓶颈
        );
        
        return new ForkJoinPool(
            parallelism,
            ForkJoinPool.defaultForkJoinWorkerThreadFactory,
            (thread, throwable) -> {
                // 自定义异常处理：记录日志
                System.err.printf("Thread %s threw exception: %s%n", 
                                 thread.getName(), throwable.getMessage());
            },
            false // asyncMode = false，使用LIFO模式
        );
    }
    
    /**
     * 搜索入口方法
     */
    public static List<SearchResult> search(Path rootDir, String keyword) {
        // 创建自定义池，避免使用公共池影响其他组件
        try (ForkJoinPool pool = createSearchPool()) {
            FileSearchTask rootTask = new FileSearchTask(rootDir, keyword);
            
            // 正确：外部客户端使用invoke()
            return pool.invoke(rootTask);
        }
    }
    
    /**
     * 错误用法示例（注释说明）
     */
    public static List<SearchResult> wrongApproach(Path rootDir, String keyword) {
        try (ForkJoinPool pool = createSearchPool()) {
            FileSearchTask rootTask = new FileSearchTask(rootDir, keyword);
            
            // 错误1：在外部客户端使用fork()
            // rootTask.fork(); // 这会在公共池执行，绕过自定义池配置
            
            // 错误2：混用API
            // 在compute()内部这样写是错误的：
            // pool.submit(subtask); // 绕过工作窃取
            // pool.invoke(anotherTask); // 阻塞当前线程
            
            // 正确：外部客户端使用invoke()
            return pool.invoke(rootTask);
        }
    }
    
    public static void main(String[] args) throws Exception {
        if (args.length < 2) {
            System.out.println("Usage: java ParallelFileSearch <directory> <keyword>");
            return;
        }
        
        Path rootDir = Paths.get(args[0]);
        String keyword = args[1];
        
        long startTime = System.currentTimeMillis();
        List<SearchResult> results = search(rootDir, keyword);
        long endTime = System.currentTimeMillis();
        
        System.out.printf("Found %d matches in %d ms%n", 
                         results.size(), endTime - startTime);
        
        // 打印前10个结果
        results.stream().limit(10).forEach(System.out::println);
    }
}

所以正确的框架是：

graph TD
    A[ForkJoinPool任务执行] --> B{使用哪个API?}
    B -->|invoke()| C[正确方式]
    B -->|submit()/execute()| D[错误方式]
    
    C --> E[触发工作窃取机制]
    C --> F[维护任务父子关系]
    C --> G[支持fork()/join()调用链]
    C --> H[同步等待结果]
    
    D --> I[无法触发工作窃取]
    D --> J[破坏任务分解结构]
    D --> K[RecursiveTask无法正常工作]

必须使用invoke()而非submit()/execute()：
- invoke()是ForkJoinPool的专用API，专为工作窃取算法设计
- 只有通过invoke()提交的任务才能正确触发fork()和join()的执行机制
- submit()/execute()提交的任务无法参与工作窃取，违背了ForkJoinPool的设计初衷
定义一个 RecursiveTask 或者 RecursiveAction，而不是直接使用 ForkJoinTask，然后让 ForkJoinPool 来 invoke 根 task。
每个任务内部：
1. 先检查任务大小，只有大任务才分解生成子任务，小任务直接计算。
2. 从子任务列表中移除最后一个任务，保留给自己直接执行。
3. 对其余子任务调用fork()（异步提交）。
4. 对保留的任务调用compute()（同步执行）。

Specification支撑：根据JSR 166规范和Doug Lea的设计原则，ForkJoinPool的invoke()方法是唯一能够正确激活工作窃取调度器的入口点。使用其他API会导致任务无法被正确分解和调度。
5. 对其他任务进行 join 收集计算结果，合并进上一个计算结果里。
6. 返回全部计算结果。
3. 所以在任务外部使用 invoke，内部使用 fork/compute/join。外部不应该用fork()/join()，看上面的 arrange。

关键设计决策解析

为什么使用 RecursiveTask 而不是 RecursiveAction？

需要返回搜索结果（List）
RecursiveTask 提供类型安全的返回值
符合分治模式：子任务结果合并为父任务结果

为什么设置THRESHOLD=100？

任务分解粒度需要平衡：
- 太小：调度开销超过计算收益
- - 太大：负载不均衡，CPU核心利用率低
100是经验值，可根据文件大小调整
通过基准测试确定最优值

为什么fork其他任务，直接执行最后一个任务？

// 优化：fork其他任务，直接执行最后一个任务（避免不必要的调度开销）
if (subtasks.size() > 1) {
    FileSearchTask lastTask = subtasks.remove(subtasks.size() - 1);
    
    for (FileSearchTask task : subtasks) {
        task.fork(); // 异步提交
    }
    
    List<SearchResult> results = lastTask.compute(); // 同步执行
    
    for (FileSearchTask task : subtasks) {
        results.addAll(task.join()); // 等待完成
    }
}

设计理由：

避免调度开销：直接compute()比fork()后再join()少一次入队出队操作
缓存局部性：直接执行的任务与父任务共享数据，保持CPU缓存热度
栈深度控制：避免过深的递归导致StackOverflowError
注意：这里的"最后一个任务"不是指"最大的任务"，而是任意选择一个任务直接执行以减少调度开销

为什么创建自定义池而不是使用公共池？

1
2
3

try (ForkJoinPool pool = createSearchPool()) {
    return pool.invoke(rootTask);
}

设计理由：

资源隔离：避免影响其他使用公共池的组件
参数定制：限制并行度（16），避免I/O瓶颈
异常处理：自定义异常处理器，确保错误可见
生命周期管理：try-with-resources确保池关闭

为什么asyncMode=false？

1	`new ForkJoinPool(parallelism, ..., false);`

设计理由：

LIFO模式：适合分治算法，保持缓存局部性
asyncMode=true：使用FIFO模式，适合事件处理
文件搜索是典型的分治场景，LIFO更高效

ForkJoinPool 与 ThreadPoolExecutor 的对比及 commonPool 实践

ForkJoinPool vs ThreadPoolExecutor 核心差异

特性	ForkJoinPool	ThreadPoolExecutor
队列架构	每个工作线程一个双端队列	全局共享队列
负载均衡	工作窃取（主动，线程闲了就去偷）	队列分发（被动，线程从队列取）
适合场景	大量短任务、CPU 密集型	IO 密集型、混合任务
线程数	固定 = CPU 核心数	可动态扩缩容（core → max）
拥塞队列	无（直接入队到工作线程）	有（可配置容量，如 LinkedBlockingQueue）
队列满时行为	队列动态扩容，任务无限排队	RejectedExecutionHandler（4种策略）
线程收缩	自动收缩（无 core thread 空转）	依赖 keepAliveTime
线程类型	守护线程（默认）	非守护线程（默认）

何时选择 ForkJoinPool 而非 ThreadPoolExecutor（非递归分治场景）：

场景	推荐选择	理由
大量细粒度任务（如并行流处理、批量计算）	FJP	工作窃取机制减少线程空闲，任务短到可快速完成时全局队列竞争会成为瓶颈
任务执行时间差异大（部分任务耗时极长，部分极短）	FJP	短任务可被其他空闲线程窃取执行，长任务不会阻塞短任务
需要最大化 CPU 利用率（CPU 密集型混合任务）	FJP	线程数固定为 CPU 核心数，避免线程切换开销，且工作窃取保证所有核心 busy
并行流（Parallel Stream）	FJP（自动使用）	`Arrays.parallelSort()`、`List.parallelStream()` 内部依赖 FJP
CompletableFuture 编排大量计算任务	FJP	`CompletableFuture.runAsync()` 默认使用 commonPool，适合 CPU 密集型任务编排
IO 密集型任务	TPE	FJP 工作线程默认为守护线程——JVM 退出时不会等待守护线程执行完毕。如果守护线程长时间阻塞（如等待网络响应），JVM 可能在任务完成前退出，导致任务被"截断"；TPE 为非守护线程，JVM 会等待其执行完毕
需要任务队列有界控制	TPE	FJP 无队列容量控制，任务无限排队风险

简言之：当你的任务是大量 CPU 密集型的短任务，且任务执行时间相对均衡或差异不大时，FJP 的工作窃取机制能提供更高的吞吐量；否则（如 IO 密集型、任务时长差异极大、需要可控的队列容量），TPE 是更稳妥的选择。

线程池的演进逻辑

从历史发展的角度看，Java 线程池经历了一个逐步演进的过程：

TPE（ThreadPoolExecutor）
    ↓
FJP（ForkJoinPool）— 削弱了 TPE 在 CPU 密集型场景的优势
    ↓
虚拟线程（Virtual Thread）— 进一步削弱了 TPE 在 IO 密集型场景的优势

没有虚拟线程的时代：

IO 密集型业务 → TPE（可动态扩缩容）
CPU 密集型业务 → FJP（工作窃取）

虚拟线程出现后：

虚拟线程让 IO 阻塞不再占用物理线程
大量 IO 密集型任务可以用极少的载体线程支撑海量并发
但 FJP 的守护线程问题仍然存在，不适合长时间阻塞

日常使用习惯：现实中 TPE 用得多，因为大多数业务是 IO 密集型。你对线程池的选择，只在追求资源利用率和性价比时才重要——只要任务能正确完成，用哪个线程池并无本质区别。

commonPool 的并发控制机制

关键问题：当大量外部线程涌入时，commonPool 会无限扩张吗？

答案：不会。commonPool 有固定的并行度限制。但需要注意：当线程被阻塞任务占用时，新任务将无限排队等待执行。

并行度计算：

commonPool 并行度 = CPU 核心数 - 1（至少为 1）
8 核 CPU → commonPool 并行度 = 7
可通过 -Djava.util.concurrent.ForkJoinPool.common.parallelism=N 覆盖

任务入队机制：当任务提交超过并行度时，ForkJoinPool 不会无限创建线程，而是：

任务入队：外部线程随机选择一个工作线程，将任务 push 到其双端队列
工作窃取：闲线程从其他线程队列尾部窃取任务
不会创建新线程：线程数固定为并行度，不会像 TPE 那样动态扩容

关键风险：线程数最终不可扩张 + 可调度资源稀缺性

队列几乎永远不会满：单个 WorkQueue 最大容量约 6700 万（MAXIMUM_QUEUE_CAPACITY = 1 << 26），在达到这个上限之前，OOM 会先触发
不存在类似 CallerRunsPolicy 的机制：ForkJoinPool 的 Javadoc 明确说明，仅在 shutdown 或内部资源耗尽时抛出 RejectedExecutionException，不会让提交线程执行任务
真正的风险是任务无限排队：多个业务共用 commonPool 时，若部分任务执行阻塞操作（如 Thread.sleep、DB 查询），会占用有限的线程资源，导致其他任务无法及时执行——这正是许多生产环境事故的根本原因

核心机制：可调度单元 vs 不可调度单元

commonPool 的根本问题在于线程数最终不可扩张，且可调度的线程比不可调度的队列元素更宝贵：

线程是 OS 可调度的执行单元，拥有独立的执行上下文和 CPU 时间片
队列中的任务只是内存中的数据结构，无法主动获取 CPU 资源，必须依赖线程来执行
当工作线程阻塞时（如 Thread.sleep），它让出了 CPU，但没有让出线程的 runnable 位置——该线程仍被标记为"活跃"，继续占用 commonPool 的并行度名额
结果是：阻塞的线程无法执行新任务，新任务只能无限排队，而 commonPool 又不会创建新线程来补偿（maximumSpares 仅用于补偿 ForkJoinTask 的 join 等待，不用于补偿外部阻塞）

结论：在父子任务场景下，maximumSpares（默认 256）可以在拆分任务时提供充足的补偿线程，避免反向的线程互锁；但对于外部提交的任务，可使用的线程不超过并行度，超过并行度的部分必须排队。

对比：若采用 newCachedThreadPool 这类近乎无限线程的方案，也不会出现父子线程死锁——每个子任务都能获得新线程执行，无需依赖协作式等待或补偿机制。代价是线程数可能无限增长，资源消耗不可控。

任务无限排队的场景：commonPool 线程数 = CPU 核心数 - 1（8 核 CPU 只有 7 个线程），若 7 个线程都被阻塞任务占用，新提交的任务只能无限排队等待——队列本身不可调度，没有可用的可调度单元（线程），任务永远无法执行。

生产环境最佳实践：

// 短任务、CPU 密集：使用 commonPool
CompletableFuture.runAsync(() -> {
    int result = expensiveComputation();
});

// 需要控制并行度：自定义 ForkJoinPool
ForkJoinPool customPool = new ForkJoinPool(4);
CompletableFuture.runAsync(() -> { /* ... */ }, customPool);

// IO 密集型任务：使用专门的线程池，不要用 commonPool
ExecutorService ioPool = Executors.newFixedThreadPool(50);
CompletableFuture.runAsync(() -> db.query(), ioPool);

// 危险：阻塞操作会占用 commonPool 线程
CompletableFuture.runAsync(() -> {
    Thread.sleep(10000);  // 会导致其他任务无限排队
});

对 CompletableFuture 的影响

CompletableFuture.runAsync() 默认使用 commonPool()（FIFO 模式），但若显式传入 LIFO 模式的线程池，任务执行顺序可能与提交顺序不同：

ForkJoinPool lifoPool = new ForkJoinPool();  // 默认 LIFO

CompletableFuture.runAsync(() -> {/* Task 1 */}, lifoPool);
CompletableFuture.runAsync(() -> {/* Task 2 */}, lifoPool);
// Task 2 可能先于 Task 1 执行（栈顶优先）

需注意：CompletableFuture 的 happens-before 关系由回调链保证，与底层线程池调度策略无关。asyncMode 仅影响独立任务的入队/出队顺序，不影响 CompletableFuture 的语义正确性。

ForkJoinPool 常见错误模式

API混用错误

在 ForkJoinTask.compute() 内部应使用 fork()/join() API，而非 pool.submit() 或 pool.invoke()。

// 错误：绕过工作窃取优化
protected void compute() {
    pool.submit(left);  // 提交到共享队列，失去局部性
    pool.invoke(right); // 完全阻塞当前线程
}

// 正确：使用 fork/join API
protected void compute() {
    left.fork();           // 无锁本地队列 push
    right.compute();       // 保持缓存局部性
    left.join();           // 协作式等待
}

I/O阻塞错误与资源泄漏

详见线程池横切对比 - 常见错误用法。

父子任务死锁：传统线程池的致命缺陷与ForkJoinPool的解决方案

问题场景：线程池饥饿死锁

在使用传统ThreadPoolExecutor时，一个经典的陷阱是父子任务使用同一线程池导致的死锁。

死锁复现代码

public class ThreadPoolDeadlockDemo {
    // 固定大小的线程池，只有2个线程
    private static final ExecutorService pool = Executors.newFixedThreadPool(2);
    
    public static void main(String[] args) throws Exception {
        // 提交2个父任务，恰好占满线程池
        Future<Integer> f1 = pool.submit(() -> parentTask("Parent-1"));
        Future<Integer> f2 = pool.submit(() -> parentTask("Parent-2"));
        
        // 永远无法完成 -- 死锁
        System.out.println("Result: " + f1.get() + ", " + f2.get());
    }
    
    static Integer parentTask(String name) throws Exception {
        System.out.println(name + " started on " + Thread.currentThread().getName());
        
        // 父任务提交子任务到同一个线程池
        Future<Integer> childFuture = pool.submit(() -> childTask(name));
        
        // 父任务阻塞等待子任务完成
        // 但子任务在队列中等待线程，而所有线程都被父任务占用
        return childFuture.get(); // 死锁点
    }
    
    static Integer childTask(String parentName) {
        System.out.println("Child of " + parentName + " on " + Thread.currentThread().getName());
        return 42;
    }
}

死锁分析

时间线：
T1: Parent-1 提交，获得 Thread-1，开始执行
T2: Parent-2 提交，获得 Thread-2，开始执行
T3: Parent-1 提交 Child-1 到队列，调用 childFuture.get() 阻塞
T4: Parent-2 提交 Child-2 到队列，调用 childFuture.get() 阻塞
T5: 死锁形成
    - Thread-1 被 Parent-1 占用，等待 Child-1
    - Thread-2 被 Parent-2 占用，等待 Child-2
    - Child-1 和 Child-2 在队列中，等待空闲线程
    - 没有空闲线程，因为都被父任务占用

这就是经典的线程池饥饿死锁（Thread Pool Starvation Deadlock）：

必要条件1：父任务持有线程资源
必要条件2：父任务阻塞等待子任务
必要条件3：子任务需要线程资源才能执行
必要条件4：线程池容量有限

传统解决方案的局限性

方案1：增大线程池容量

1	`ExecutorService pool = Executors.newFixedThreadPool(100);`

问题：

无法预知任务的嵌套深度
递归分治算法的任务数量呈指数增长
过大的线程池浪费资源，过小仍可能死锁

方案2：使用无界线程池

1	`ExecutorService pool = Executors.newCachedThreadPool();`

问题：

失去对并发度的控制
可能创建过多线程，导致OOM或上下文切换开销
不适合生产环境

方案3：父子任务使用不同线程池

1 2	`ExecutorService parentPool = Executors.newFixedThreadPool(4); ExecutorService childPool = Executors.newFixedThreadPool(8);`

问题：

需要预知任务层级结构
多层嵌套需要多个线程池
资源利用率低，管理复杂

ForkJoinPool的根本性解决：协作式等待

ForkJoinPool通过协作式等待（Cooperative Waiting）从根本上解决了这个问题。

核心机制：join()不是真正的阻塞

// ForkJoinTask.join() 的简化逻辑
public final V join() {
    int s;
    if ((s = doJoin() & DONE_MASK) != NORMAL)
        reportException(s);
    return getRawResult();
}

private int doJoin() {
    int s; Thread t; ForkJoinWorkerThread wt; ForkJoinPool.WorkQueue w;
    
    // 1. 检查任务是否已完成
    if ((s = status) < 0)
        return s;
    
    // 2. 如果当前线程是 ForkJoinWorkerThread
    if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) {
        wt = (ForkJoinWorkerThread)t;
        w = wt.workQueue;
        
        // 3. 尝试从本地队列弹出并执行目标任务
        if (w.tryUnpush(this) && (s = doExec()) < 0)
            return s;
        
        // 4. 如果目标任务不在本地队列顶部，进入协作等待
        return wt.pool.awaitJoin(w, this, 0L);
    }
    
    // 5. 非 ForkJoinWorkerThread，使用外部等待
    return externalAwaitDone();
}

tryUnpush() 与 doExec()：本地任务的快速执行

doJoin() 中的关键调用：

1 2	`if (w.tryUnpush(this) && (s = doExec()) < 0) return s;`

tryUnpush(this)：尝试从本地队列弹出目标任务

工作队列是双端队列，fork() 将任务压入队尾
tryUnpush() 检查目标任务是否在队尾，若是则弹出
仅当任务未被其他线程窃取时才能成功

// WorkQueue.tryUnpush() 简化逻辑
// 设计动因：fork() 将任务压入队尾，join() 时若任务仍在队尾，直接弹出执行比等待窃取更快
final boolean tryUnpush(ForkJoinTask<?> task) {
    ForkJoinTask<?>[] a; int s;
    
    // 1. 检查队列非空：(top - base) > 0 表示有元素
    if ((a = array) != null && (s = top) - base > 0) {
        
        // 2. 检查队尾是否为目标任务：a[s - 1] 是队尾元素（top 指向下一个空位）
        if (a[s - 1] == task &&
            
            // 3. CAS 弹出：无锁操作，仅当队尾仍为 task 时才成功
            //    如果其他线程已窃取该任务，CAS 失败，返回 false
            U.compareAndSwapObject(a, offset, task, null)) {
            
            // 4. 更新队尾指针：top-- 表示队尾任务已弹出
            top = s - 1;
            return true;
        }
    }
    return false;  // 队列为空、任务不在队尾、或已被窃取
}

doExec()：执行任务的 compute() 方法

弹出成功后立即执行，无需调度
执行完成后设置 status 为负数（NORMAL/EXCEPTIONAL）

// ForkJoinTask.doExec() 简化逻辑
// 设计动因：弹出任务后立即执行，无需调度，减少上下文切换
private int doExec() {
    int s; boolean completed;
    
    // 1. 检查任务状态：status >= 0 表示未完成
    if ((s = status) >= 0) {
        try {
            // 2. 执行任务：exec() 内部调用 compute()
            completed = exec();
        } catch (Throwable rex) {
            // 3. 异常处理：设置 EXCEPTIONAL 状态并传播异常
            return setExceptionalCompletion(rex);
        }
        // 4. 正常完成：设置 status = NORMAL（负数）
        if (completed)
            s = setCompletion(NORMAL);
    }
    // 5. 返回最终状态：负数表示已完成
    return s;
}

为什么先 tryUnpush 再 doExec？

如果任务还在本地队尾，直接弹出执行比等待其他线程窃取更快
这是一种"自我窃取"，避免了任务在不同线程间传递的开销
如果 tryUnpush 失败（任务已被窃取或不在队尾），才进入 awaitJoin()

协作等待的核心：awaitJoin()

// ForkJoinPool.awaitJoin() 简化逻辑
// 设计动因：协作式等待——不是被动阻塞，而是主动寻找可执行的工作
final int awaitJoin(WorkQueue w, ForkJoinTask<?> task, long deadline) {
    int s = 0;
    if (task != null) {
        // 1. 循环直到任务完成：status < 0 表示已完成
        while ((s = task.status) >= 0) {
            
            // 2. 尝试帮助窃取者：如果任务被其他线程窃取，扫描其队列帮助执行
            if (!tryHelpStealer(w, task))
                
                // 3. 尝试补偿：如果无法帮助，考虑创建新线程补偿
                if (!tryCompensate(w))
                    
                    // 4. 最终阻塞：仅当无事可做时才真正阻塞
                    LockSupport.park(this);
        }
    }
    return s;  // 返回任务最终状态
}

帮助窃取者机制（Help Stealer）

当线程A等待任务T完成时，如果T被线程B窃取：

A不会阻塞等待
A会扫描B的工作队列
A帮助执行B队列中的任务（可能是T的子任务）
通过帮助B，间接加速T的完成

场景：Thread-1 执行 Parent，fork 了 Child，然后 join(Child)
      Child 被 Thread-2 窃取

传统线程池：
  Thread-1: [阻塞等待 Child 完成] <-- 线程资源浪费
  Thread-2: [执行 Child]

ForkJoinPool：
  Thread-1: [发现 Child 被 Thread-2 窃取]
            [扫描 Thread-2 的队列]
            [帮助执行 Thread-2 队列中的其他任务]
            [间接加速 Child 完成]
  Thread-2: [执行 Child]

为什么父子任务可以不相互阻塞？

这个问题的答案涉及ForkJoinTask接口设计的精妙之处：

接口层面的异步化解耦

ForkJoinTask的fork()和join()方法在接口设计上实现了计算与等待的解耦：

// fork() 只是将任务入队，不执行
public final ForkJoinTask<V> fork() {
    Thread t;
    if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread)
        ((ForkJoinWorkerThread)t).workQueue.push(this);
    else
        ForkJoinPool.common.externalPush(this);
    return this;
}

// join() 不是简单等待，而是"参与式等待"
public final V join() {
    if (doJoin() != NORMAL)
        throw new RuntimeException();
    return getRawResult();
}

关键设计点：

fork()是纯异步的：只负责将任务放入队列，立即返回
join()是协作式的：不是被动等待，而是主动寻找可执行的工作
compute()是可分解的：子类通过重写compute()定义分解逻辑

分治模式的天然适配

protected Integer compute() {
    if (任务足够小) {
        return 直接计算();
    }
    
    // 分解
    SubTask left = new SubTask(左半部分);
    SubTask right = new SubTask(右半部分);
    
    // fork() 只是入队，不阻塞
    left.fork();
    
    // 当前线程直接执行 right，不入队
    int rightResult = right.compute();
    
    // join() 时，如果 left 还在本地队列，直接弹出执行
    // 如果被窃取，则帮助窃取者执行其他任务
    int leftResult = left.join();
    
    // 合并
    return leftResult + rightResult;
}

为什么不会死锁：

right.compute()直接在当前线程执行，不占用额外线程
left.join()时，如果left还在本地队列顶部，直接弹出执行（tryUnpush）
如果left被窃取，当前线程不会阻塞，而是帮助执行其他任务
即使所有线程都在"等待"，它们实际上都在执行任务

线程补偿机制：有限度的弹性

线程可以无限补偿吗？

答案是否定的。ForkJoinPool的线程补偿受到maximumSpares参数的严格限制。

补偿机制的工作原理

// tryCompensate() 的简化逻辑
private boolean tryCompensate(WorkQueue w) {
    // 检查是否可以创建补偿线程
    int sp = (int)(ctl & ~SMASK);
    int pc = config & SMASK;  // parallelism
    
    // 计算当前spare线程数
    int tc = (short)(ctl >>> TC_SHIFT);
    int ac = (int)(ctl >> AC_SHIFT);
    
    // 如果spare线程数已达上限，不再创建
    if (tc >= pc + MAX_SPARES) // MAX_SPARES 默认为 256
        return false;
    
    // 创建补偿线程
    if (/* 条件满足 */) {
        createWorker();
        return true;
    }
    return false;
}

线程数的硬性上限

ForkJoinPool的线程数永远不会超过：parallelism + maximumSpares

1 2	`// 系统属性配置 java.util.concurrent.ForkJoinPool.common.maximumSpares = 256 // 默认值`

当达到上限后会发生什么？

无法创建新的补偿线程
tryCompensate()返回false
线程进入真正的阻塞等待（LockSupport.park）
如果所有线程都阻塞，可能导致吞吐量下降

为什么要限制补偿？

防止线程爆炸：无限补偿可能导致创建过多线程
资源保护：每个线程都消耗栈内存（默认1MB）
上下文切换开销：过多线程导致调度开销增加
设计哲学：ForkJoinPool假设任务是CPU密集型的，不应频繁阻塞

最佳实践

避免在ForkJoinTask中执行阻塞I/O
如果必须阻塞，使用ManagedBlocker接口
合理设置parallelism和maximumSpares
监控getPoolSize()和getActiveThreadCount()

// 使用ManagedBlocker处理阻塞操作
ForkJoinPool.managedBlock(new ForkJoinPool.ManagedBlocker() {
    @Override
    public boolean block() throws InterruptedException {
        // 执行阻塞操作
        result = blockingOperation();
        return true;
    }
    
    @Override
    public boolean isReleasable() {
        // 检查是否已完成
        return result != null;
    }
});

对比验证

ForkJoinPool版本（不会死锁）

public class ForkJoinNoDeadlockDemo {
    private static final ForkJoinPool pool = new ForkJoinPool(2);
    
    public static void main(String[] args) {
        Integer result = pool.invoke(new ParentTask("Root"));
        System.out.println("Result: " + result); // 正常完成
    }
    
    static class ParentTask extends RecursiveTask<Integer> {
        private final String name;
        
        ParentTask(String name) { this.name = name; }
        
        @Override
        protected Integer compute() {
            System.out.println(name + " on " + Thread.currentThread().getName());
            
            // 创建子任务
            ChildTask child1 = new ChildTask(name + "-Child1");
            ChildTask child2 = new ChildTask(name + "-Child2");
            
            // fork 子任务
            child1.fork();
            child2.fork();
            
            // join 不会死锁
            // 当前线程会帮助执行子任务，而不是阻塞等待
            return child1.join() + child2.join();
        }
    }
    
    static class ChildTask extends RecursiveTask<Integer> {
        private final String name;
        
        ChildTask(String name) { this.name = name; }
        
        @Override
        protected Integer compute() {
            System.out.println(name + " on " + Thread.currentThread().getName());
            return 21;
        }
    }
}

执行结果

Root on ForkJoinPool-1-worker-1
Root-Child1 on ForkJoinPool-1-worker-1  // 父线程帮助执行子任务
Root-Child2 on ForkJoinPool-1-worker-2
Result: 42

注意：即使只有2个线程，父任务也能完成，因为父线程在join()时直接执行了Child1。

设计启示

特性	ThreadPoolExecutor	ForkJoinPool
等待语义	阻塞等待（浪费线程）	协作等待（帮助执行）
父子任务	可能死锁	天然支持
线程利用率	等待时为0	等待时仍在工作
线程补偿	无	有限度补偿（maximumSpares）
适用场景	独立任务	分治/递归任务

要点：ForkJoinPool的join()不是"等待"，而是"参与"。线程不会因为等待子任务而闲置，而是主动寻找可执行的工作。这种设计从根本上消除了父子任务死锁的可能性，同时通过有限度的线程补偿机制，在保证系统稳定性的前提下提供了额外的弹性。

结论：设计的本质

ForkJoinPool不是"另一个线程池"，而是为分治并行量身定制的执行引擎。其核心设计决策源于对问题域的深刻理解：

任务结构驱动执行模型：分治算法的"父-子"任务结构要求特殊的调度策略，工作窃取正是为这种结构优化。
局部性优先于公平性：LIFO本地执行牺牲任务执行的公平性，换取时间局部性的显著提升。
协作优于竞争：线程从"竞争共享资源"转变为"协作完成任务"，资源利用率显著提高。
动态适应优于静态配置：与ThreadPoolExecutor的"核心-最大"静态模型不同，ForkJoinPool通过目标并行度+spare线程机制，动态适应工作负载。
资源效率优于固定开销：与TPE保持核心线程不同，FJP回收所有空闲线程，适合间歇性负载。

正如Doug Lea在论文结论中所述：

“This paper has demonstrated that it is possible to support portable, efficient, scalable parallel processing in pure Java, with a programming model and framework that can be convenient for programmers.”

（本论文证明了，纯粹的Java语言也能够实现可移植、高效可伸缩的并行处理，并且能够为程序员提供便捷的编程模型和框架。）

理解ForkJoinPool的核心数据结构和设计哲学，才能在正确场景发挥其价值。它不是万能的，但在分治并行领域，它代表了并发计算的理论最优解。

ForkJoinPool参考文献：

Doug Lea. “A Java Fork/Join Framework”. In Proceedings of the ACM 2000 conference on Java Grande, 2000. https://gee.cs.oswego.edu/dl/papers/fj.pdf

线程池横切对比

本章节横切对比 ThreadPoolExecutor、ScheduledThreadPoolExecutor、ForkJoinPool 三种线程池实现在队列架构、execute 方法、异常处理、生命周期管理等方面的差异。

WorkQueue 队列架构对比

Java 线程池体系中的三种核心实现在任务队列的设计上有着根本性的差异，这些差异直接决定了它们各自的适用场景和性能特征。

队列架构对比总览

特性	ThreadPoolExecutor	ScheduledThreadPoolExecutor	ForkJoinPool
队列类型	单一共享阻塞队列	单一共享延迟队列	每线程私有双端队列
队列实现	`BlockingQueue<Runnable>`（可配置）	`DelayedWorkQueue`（内置）	`WorkQueue[]`（内置）
数据结构	链表/数组（依具体实现）	二叉堆（最小堆）	环形数组
访问模式	FIFO（先进先出）	按时间优先级	LIFO/FIFO（可配置）
线程竞争	高（所有线程共享）	高（所有线程共享）	低（本地操作无锁）

ThreadPoolExecutor 的 BlockingQueue

ThreadPoolExecutor 使用单一共享的 BlockingQueue<Runnable> 作为任务缓冲区，这是最经典的生产者-消费者模式。

核心特性：

可配置性：允许用户在构造时传入任意 BlockingQueue 实现
共享竞争：所有工作线程从同一队列获取任务，存在锁竞争
容量可控：可选择有界队列（防止 OOM）或无界队列（提高吞吐）

常用队列选择：

队列类型	有界性	适用场景	风险
`ArrayBlockingQueue`	有界	生产消费速率相近，需控制内存	无
`LinkedBlockingQueue`	可配置	IO 密集型，需要缓冲	默认无界，可能 OOM
`SynchronousQueue`	无容量	任务需立即执行，CachedThreadPool	可能创建大量线程
`PriorityBlockingQueue`	无界	任务有优先级区分	可能 OOM

任务调度流程：

新任务到达 → 线程数 < core? → 创建核心线程
           → 线程数 ≥ core 且队列未满? → 入队等待
           → 线程数 ≥ core 且队列已满 且 线程数 < max? → 创建非核心线程
           → 线程数 = max 且队列已满? → 触发拒绝策略

详细说明见 ThreadPoolExecutor 任务缓冲章节。

ScheduledThreadPoolExecutor 的 DelayedWorkQueue

基于**二叉堆（最小堆）**实现的延迟队列，任务按执行时间排序，最早到期的任务位于堆顶。

操作	时间复杂度	说明
入队	O(log n)	堆调整
出队	O(log n)	取堆顶 + 堆调整
查看队首	O(1)	直接访问堆顶

核心机制：Leader-Follower 模式避免多线程同时等待导致的唤醒风暴。

数据结构选择（二叉堆vs跳表）、Leader-Follower 工作原理详见 DelayedWorkQueue 的数据结构选择。

ForkJoinPool 的 WorkQueue

ForkJoinPool 采用每线程私有双端队列的架构，这是工作窃取算法的基础。

核心特性：队列私有化（避免共享竞争）、双端操作（owner 用 top，stealer 用 base）、本地操作无锁化（仅窃取用 CAS）、动态扩容（最大约 6700 万任务）。

数据结构：

static final class WorkQueue {
    volatile int base;          // 队列头部索引（窃取端）
    volatile int top;           // 队列尾部索引（本地端）
    ForkJoinTask<?>[] array;    // 任务数组（环形缓冲区）
    final ForkJoinWorkerThread owner; // 所属线程
}

操作模式：owner 从 top 端 push/pop（LIFO/FIFO 由 asyncMode 决定），stealer 从 base 端 poll（始终 FIFO）。

工作窃取的完整原理、LIFO/FIFO 设计智慧详见工作窃取机制详解章节。

三者架构图示

ThreadPoolExecutor:
┌─────────────────────────────────────┐
│         BlockingQueue (共享)         │
│   [T1][T2][T3][T4][T5][T6][T7]      │
└──────────────┬──────────────────────┘
               │ FIFO
     ┌─────────┼─────────┐
     ↓         ↓         ↓
  [Worker1] [Worker2] [Worker3]
  (竞争锁)

ScheduledThreadPoolExecutor:
┌─────────────────────────────────────┐
│       DelayedWorkQueue (共享)        │
│   堆结构：按时间排序                 │
│      [T1s后]                        │
│     /      \                        │
│ [T3s后]  [T2s后]                    │
└──────────────┬──────────────────────┘
               │ 按到期时间
     ┌─────────┼─────────┐
     ↓         ↓         ↓
  [Worker1] [Worker2] [Worker3]
  (Leader-Follower)

ForkJoinPool:
┌───────────┐ ┌───────────┐ ┌───────────┐
│ WorkQueue1 │ │ WorkQueue2 │ │ WorkQueue3 │
│ [T1][T2]  │ │ [T3][T4]  │ │ [T5][T6]  │
└─────┬─────┘ └─────┬─────┘ └─────┬─────┘
      │             │             │
      ↓             ↓             ↓
  [Worker1]     [Worker2]     [Worker3]
      │             │             │
      └─────窃取────┴─────窃取────┘
        (无锁本地操作 + CAS窃取)

设计哲学对比

维度	ThreadPoolExecutor	ScheduledThreadPoolExecutor	ForkJoinPool
调度模型	生产者-消费者	定时调度	工作窃取
队列目的	解耦 + 缓冲	时间排序 + 延迟执行	负载均衡 + 局部性
竞争点	队列锁	队列锁	窃取时 CAS
拒绝策略	必须配置	继承自 TPE	无需配置（队列动态扩容）
适用场景	通用任务	定时/周期任务	分治并行计算

execute() 实现对比

Executor 接口只定义了一个方法 execute(Runnable)，但三种线程池实现赋予了它完全不同的语义。理解这些差异，有助于选择正确的线程池类型。

实现对比总览

特性	ThreadPoolExecutor	ScheduledThreadPoolExecutor	ForkJoinPool
execute 语义	立即执行	延迟为0的调度	包装后提交外部队列
是否调用父类 execute	N/A（基类）	否，重写为 schedule(0)	N/A（独立实现）
任务入队方式	条件判断后入队或创建线程	直接 add + ensurePrestart	包装后 externalPush
线程创建时机	execute 中动态判断	ensurePrestart 预创建	懒加载
队列访问	通过 queue 成员	super.getQueue()	externalPush → 共享队列

ThreadPoolExecutor：经典的"三段式"判断

ThreadPoolExecutor 的 execute() 实现是最经典的线程池调度逻辑：

任务到达 → workerCount < core? → 创建核心线程
         → 队列未满? → 入队等待
         → workerCount < max? → 创建非核心线程
         → 触发拒绝策略

核心特点：

execute 内部包含完整的调度逻辑（线程创建、入队、拒绝）
线程创建是动态的，根据当前状态实时决策
队列通过构造器注入，execute 只负责使用

这是其他线程池设计的"参照系"——理解它才能理解其他实现为何不同。

ScheduledThreadPoolExecutor：语义转换 + 直接入队

@Override
public void execute(Runnable command) {
    schedule(command, 0, NANOSECONDS);  // 重写为 schedule(0)
}

schedule() 内部调用 delayedExecute() 直接入队。delayedExecute() 的详细实现见 ScheduledExecutorService 与 AbstractExecutorService 的关系辨析章节。

设计意图：

API 兼容：继承 ThreadPoolExecutor，必须实现 execute() 接口
强制统一路径：所有任务都走 schedule → DelayedWorkQueue，确保延时语义一致
跳过三段式判断：直接入队 + ensurePrestart，因为定时任务不适合"队列满则创建线程"的逻辑

为什么不调用 super.execute()?

如果调用 super.execute(command)，任务会走父类的三段式判断。虽然 ScheduledThreadPoolExecutor 构造器已硬编码 DelayedWorkQueue，但 execute 也必须重写才能确保所有任务都走统一的 schedule 路径，而非父类的入队逻辑。

ForkJoinPool：包装 + 外部队列

@Override
public void execute(Runnable task) {
    if (task == null) throw new NullPointerException();
    ForkJoinTask<?> job;
    if (task instanceof ForkJoinTask)
        job = (ForkJoinTask<?>) task;  // 已是 ForkJoinTask，无需包装
    else
        job = new RunnableExecuteAdapter(task);  // 包装为 ForkJoinTask
    externalPush(job);  // 提交到外部队列
}

设计意图：

类型适配：Runnable 必须包装为 ForkJoinTask 才能进入工作窃取体系
统一入口：无论外部提交还是内部 fork，最终都通过 externalPush 进入队列
独立体系：ForkJoinPool 继承 AbstractExecutorService 而非 ThreadPoolExecutor，execute 是全新实现

externalPush vs super.execute：

ForkJoinPool 没有继承 ThreadPoolExecutor，所以不存在"是否调用父类 execute"的问题。它的 execute 实现是独立设计的，核心是：

包装任务（如果需要）
提交到共享的 external queue
工作窃取机制负责后续调度

对比图示

ThreadPoolExecutor:
execute(Runnable) ──┬── workerCount < core? ──→ addWorker() 创建核心线程
                    ├── 队列未满? ──→ queue.offer() 入队
                    ├── workerCount < max? ──→ addWorker() 创建非核心线程
                    └── else ──→ reject() 拒绝

ScheduledThreadPoolExecutor:
execute(Runnable) ──→ schedule(0) ──→ delayedExecute()
                                            ├── super.getQueue().add(task)  // 直接入队
                                            └── ensurePrestart()            // 确保线程存在

ForkJoinPool:
execute(Runnable) ──→ 包装为 ForkJoinTask ──→ externalPush(job)
                                              └→ 提交到共享队列
                                                 └→ 工作窃取调度

核心洞察

三种实现的差异源于各自的设计目标：

设计目标	execute 实现策略
ThreadPoolExecutor：通用任务执行	execute 包含完整调度逻辑，灵活但复杂
ScheduledThreadPoolExecutor：延时/周期调度	execute 语义转换，强制走延时队列
ForkJoinPool：分治并行计算	execute 是适配层，核心在工作窃取

一句话总结：ThreadPoolExecutor 的 execute 是调度中枢；ScheduledThreadPoolExecutor 的 execute 是语义转换；ForkJoinPool 的 execute 是类型适配。

异常处理汇总

三种线程池的异常处理对比

维度	ThreadPoolExecutor	ScheduledThreadPoolExecutor	ForkJoinPool
任务异常传播	Worker继续存活，取下一个任务	周期任务异常导致后续调度终止	任务状态记录异常，不影响其他任务
异常捕获位置	Worker.run() 的 finally 块	FutureTask.runAndReset()	ForkJoinTask.setException()
异常后线程行为	线程继续存活	线程继续存活，但任务不再调度	线程继续存活
异常获取方式	Future.get() 抛出 ExecutionException	Future.get() 永久阻塞（周期任务）	ForkJoinTask.get() 抛出 ExecutionException

ThreadPoolExecutor 异常处理

普通任务抛出未捕获异常后，Worker 线程继续存活，从队列取下一个任务。异常可通过 Future.get() 获取。

// 正确做法：任务内部捕获异常
executor.submit(() -> {
    try {
        riskyOperation();
    } catch (Throwable t) {
        logger.error("Task failed", t);
    }
});

ScheduledThreadPoolExecutor 异常处理

铁律：周期任务必须用 try-catch(Throwable) 包裹全部逻辑，否则任务会在首次异常后停止后续调度。

// 正确做法：周期任务必须捕获所有异常
scheduler.scheduleAtFixedRate(() -> {
    try {
        periodicTask();
    } catch (Throwable t) {
        logger.error("Periodic task failed, will continue", t);
    }
}, 0, 1, TimeUnit.SECONDS);

详细源码分析见周期任务异常终止的深度解析。

ForkJoinPool 异常处理

ForkJoinTask 执行异常会通过 setException() 记录，不影响其他任务。异常可通过 ForkJoinTask.get() 或 ForkJoinTask.exception() 获取。

// ForkJoinTask 异常处理
ForkJoinTask<?> task = pool.submit(() -> {
    throw new RuntimeException("Task failed");
});

try {
    task.get();  // 抛出 ExecutionException
} catch (ExecutionException e) {
    logger.error("Task failed", e.getCause());
}

常见错误用法

错误1: 使用无界队列导致OOM

newFixedThreadPool 使用 LinkedBlockingQueue（默认容量 Integer.MAX_VALUE），任务积压会导致堆内存耗尽。

正确做法：使用有界队列 + 拒绝策略。

错误2: newCachedThreadPool导致线程爆炸

newCachedThreadPool 最大线程数为 Integer.MAX_VALUE，任务持续提交会无限创建线程。

正确做法：限制最大线程数。

错误3: 不设置线程名称导致排查困难

默认线程名为 pool-1-thread-1，多个线程池时无法区分。

正确做法：自定义 ThreadFactory 设置有意义的名称。

错误4: shutdown 后立即 awaitTermination

shutdown() 只是不再接受新任务，队列中的任务还在执行。立即 awaitTermination 可能导致任务丢失。

正确做法：根据业务设置合理的等待时间，分阶段关闭。

错误5: ForkJoinPool 中执行阻塞I/O

ForkJoinPool 设计用于 CPU 密集型计算，阻塞 I/O 会占用有限的线程资源，导致其他任务无限排队。

正确做法：I/O 操作使用独立的线程池。

错误6: ForkJoinPool 不关闭

ForkJoinPool 不会自动释放线程池实例持有的内部资源。

正确做法：显式调用 shutdown() 或使用 try-with-resources（JDK 19+）。

生命周期管理对比

关闭机制对比

维度	ThreadPoolExecutor	ScheduledThreadPoolExecutor	ForkJoinPool
关闭入口	shutdown() / shutdownNow()	继承自 TPE	shutdown() / shutdownNow()
优雅关闭	awaitTermination()	继承自 TPE	awaitQuiescence()
状态机	RUNNING → SHUTDOWN/STOP → TIDYING → TERMINATED	继承自 TPE	无显式状态机，通过 ctl 字段管理
线程回收	依赖 keepAliveTime	继承自 TPE	所有线程空闲时自动回收

ThreadPoolExecutor 生命周期

RUNNING（接受新任务，处理队列任务）
    ↓ shutdown()
SHUTDOWN（拒绝新任务，处理队列任务）
    ↓ shutdownNow()
STOP（拒绝新任务，不处理队列任务，中断正在执行任务）
    ↓ 队列空且线程数为0
TIDYING（执行 terminated() 钩子）
    ↓ terminated() 完成
TERMINATED（终止完成）

ForkJoinPool 生命周期

ForkJoinPool 没有显式的状态机，通过 ctl 字段管理线程状态。所有线程在空闲时都会被回收，不存在 core thread 空转问题。

// ForkJoinPool 优雅关闭
pool.shutdown();
if (!pool.awaitTermination(60, TimeUnit.SECONDS)) {
    pool.shutdownNow();
}

// JDK 19+ 可使用 try-with-resources
try (ForkJoinPool pool = new ForkJoinPool()) {
    pool.invoke(task);
} // 自动调用 shutdown() 和 awaitTermination()

监控指标对比

三种线程池的监控API

指标	ThreadPoolExecutor	ScheduledThreadPoolExecutor	ForkJoinPool
当前线程数	getPoolSize()	继承自 TPE	getPoolSize()
活跃线程数	getActiveCount()	继承自 TPE	getActiveThreadCount()
最大线程数	getMaximumPoolSize()	继承自 TPE	getParallelism()
队列大小	getQueue().size()	继承自 TPE	getQueuedSubmissionCount()
已完成任务数	getCompletedTaskCount()	继承自 TPE	getStealCount()（窃取次数）
拒绝次数	需自行包装 RejectedExecutionHandler	继承自 TPE	无（仅在 shutdown/资源耗尽时拒绝）

ThreadPoolExecutor 监控实践

// 核心监控指标
int activeCount = executor.getActiveCount();
int poolSize = executor.getPoolSize();
int queueSize = executor.getQueue().size();
long completedTasks = executor.getCompletedTaskCount();

// 计算活跃度
double activeRatio = (double) activeCount / executor.getMaximumPoolSize();

// 计算队列使用率
int queueCapacity = queueSize + executor.getQueue().remainingCapacity();
double queueUsageRatio = (double) queueSize / queueCapacity;

ForkJoinPool 监控实践

// ForkJoinPool 特有指标
long stealCount = pool.getStealCount();           // 总窃取次数
int queuedTasks = pool.getQueuedSubmissionCount(); // 外部队列任务数
int activeThreads = pool.getActiveThreadCount();   // 活跃线程数
boolean isQuiescent = pool.awaitQuiescence(1, TimeUnit.SECONDS); // 等待空闲

The Executors

provides convenient factory methods for these Executors.

常用工厂方法详解

java.util.concurrent.Executors 类提供了多个工厂方法用于创建预配置的线程池实现。这些方法简化了常见场景下的线程池创建，但开发者必须理解其内部配置的适用场景和潜在风险。

graph TB
    A[Executors 工厂方法] --> B[newFixedThreadPool]
    A --> C[newCachedThreadPool]
    A --> D[newSingleThreadExecutor]
    A --> E[newSingleThreadScheduledExecutor]
    A --> F[newScheduledThreadPool]
    A --> G[newWorkStealingPool]
    
    B --> B1["固定大小线程池"]
    B --> B2["无界队列"]
    B --> B3["适用于限流场景"]
    
    C --> C1["可缓存线程池"]
    C --> C2["SynchronousQueue"]
    C --> C3["适用于短任务"]
    
    D --> D1["单线程执行器"]
    D --> D2["无界队列"]
    D --> D3["顺序执行保证"]
    
    E --> E1["单线程调度器"]
    E --> E2["支持定时/周期"]
    E --> E3["顺序调度保证"]
    
    F --> F1["多线程调度器"]
    F --> F2["支持定时/周期"]
    F --> F3["固定大小"]
    
    G --> G1["工作窃取池"]
    G --> G2["ForkJoinPool"]
    G --> G3["并行任务优化"]

newFixedThreadPool

public static ExecutorService newFixedThreadPool(int nThreads) {
    return new ThreadPoolExecutor(nThreads, nThreads,
                                  0L, TimeUnit.MILLISECONDS,
                                  new LinkedBlockingQueue<Runnable>(),
                                  Executors.defaultThreadFactory(),
                                  defaultHandler);
}

内部配置：

核心线程数：nThreads
最大线程数：nThreads（等于核心线程数）
空闲线程存活时间：0
工作队列：LinkedBlockingQueue（无界队列）
拒绝策略：AbortPolicy（抛出 RejectedExecutionException）

优点：

线程数量固定，资源消耗可预测，适合限流场景
通过无界队列保证任务不会丢失
核心线程不会回收，减少线程创建开销

缺点：

无界队列风险：任务提交速度持续超过处理速度时，队列会无限增长，可能导致 OutOfMemoryError
无法应对突发性任务高峰（因为最大线程数等于核心线程数）
队列积压会导致任务延迟增加

适用场景：

任务执行时间相对稳定
需要限制系统资源使用
任务可以接受排队等待
典型应用：数据库连接池辅助、限流的批处理任务

newCachedThreadPool

public static ExecutorService newCachedThreadPool() {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                  60L, TimeUnit.SECONDS,
                                  new SynchronousQueue<Runnable>(),
                                  Executors.defaultThreadFactory(),
                                  defaultHandler);
}

内部配置：

核心线程数：0
最大线程数：Integer.MAX_VALUE（理论无界）
空闲线程存活时间：60秒
工作队列：SynchronousQueue（不存储元素，直接传递）
拒绝策略：AbortPolicy

命名解析：
"cached"源于其核心的线程缓存复用机制：

线程执行完任务后进入60秒缓存期而非立即销毁
缓存期内的新任务可直接复用现有线程
减少线程创建/销毁开销，实现资源的有效利用
这种设计使线程池能够在任务执行间隙实现线程复用，体现了"缓存"的核心语义。

优点：

能够快速响应大量短时任务
空闲线程自动回收，节省资源
无队列积压，任务提交即执行（有空闲线程时）

缺点：

线程数无界风险：任务提交速度持续超过处理速度时，线程数会无限增长，可能导致 OutOfMemoryError 或系统资源耗尽
不适合长时间运行的任务
线程创建和销毁有性能开销

适用场景：

大量短时异步任务
任务执行时间不可预测但通常很短
对响应速度要求高
典型应用：异步日志记录、HTTP 请求分发

newSingleThreadExecutor

public static ExecutorService newSingleThreadExecutor() {
    return new FinalizableDelegatedExecutorService
        (new ThreadPoolExecutor(1, 1,
                                0L, TimeUnit.MILLISECONDS,
                                new LinkedBlockingQueue<Runnable>(),
                                Executors.defaultThreadFactory(),
                                defaultHandler));
}

内部配置：

核心线程数：1
最大线程数：1
空闲线程存活时间：0
工作队列：LinkedBlockingQueue（无界队列）
拒绝策略：AbortPolicy

优点：

保证任务按提交顺序执行（FIFO）
无并发安全问题（单线程）
不可重新配置（委托模式封装）

套壳机制解析：

FinalizableDelegatedExecutorService 解决两个问题：

防止重新配置：DelegatedExecutorService 将 ThreadPoolExecutor 包装为仅暴露 ExecutorService 接口，调用者无法强转为 ThreadPoolExecutor 调用 setCorePoolSize() 等方法，从而保证 Javadoc 承诺的"guaranteed not to be reconfigurable to use additional threads"
防止资源泄漏：FinalizableDelegatedExecutorService 在 finalize() 中自动调用 shutdown()，避免用户忘记关闭线程池导致的资源泄漏。JDK 9+ 将其重命名为 AutoShutdownDelegatedExecutorService，语义更清晰

对比：newFixedThreadPool(1) 直接返回 ThreadPoolExecutor，可被强转后修改线程数

缺点：

无界队列风险：任务积压可能导致 OOM
吞吐量受限于单线程性能
任务执行失败会影响后续任务

适用场景：

需要保证执行顺序的任务
避免并发竞争的场景
事务性操作（需要串行化）
典型应用：数据库事务操作、文件顺序写入

newSingleThreadScheduledExecutor

public static ScheduledExecutorService newSingleThreadScheduledExecutor() {
    return new DelegatedScheduledExecutorService
        (new ScheduledThreadPoolExecutor(1));
}

内部配置：

基于 ScheduledThreadPoolExecutor，核心线程数为1
支持 schedule、scheduleAtFixedRate、scheduleWithFixedDelay
使用 DelayedWorkQueue 作为工作队列

优点：

支持定时和周期性任务
保证任务顺序执行
延迟任务调度精确

缺点：

单线程限制吞吐量
周期任务执行时间过长会影响后续调度
任务异常会导致后续周期任务停止

适用场景：

定时任务（如心跳检测）
周期性数据清理
需要严格顺序的定时任务

newScheduledThreadPool

1
2
3

public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
    return new ScheduledThreadPoolExecutor(corePoolSize);
}

内部配置：

核心线程数：corePoolSize
最大线程数：Integer.MAX_VALUE
工作队列：DelayedWorkQueue
支持延迟和周期性任务

优点：

支持定时和周期性任务
多线程提高吞吐量
延迟调度精确

缺点：

最大线程数无界
周期任务执行时间过长会影响后续调度
相比 newSingleThreadScheduledExecutor 无顺序保证

适用场景：

多定时任务并发执行
周期性任务需要并行处理
批量定时调度

newWorkStealingPool（JDK 8+）

public static ExecutorService newWorkStealingPool() {
    return new ForkJoinPool
        (Runtime.getRuntime().availableProcessors(),
         ForkJoinPool.defaultForkJoinWorkerThreadFactory,
         null, true);
}

public static ExecutorService newWorkStealingPool(int parallelism) {
    return new ForkJoinPool
        (parallelism,
         ForkJoinPool.defaultForkJoinWorkerThreadFactory,
         null, true);
}

内部配置：

基于 ForkJoinPool
默认并行度：Runtime.getRuntime().availableProcessors()
工作窃取算法优化任务分配
使用 ForkJoinPool.WorkQueue

优点：

工作窃取算法提高 CPU 利用率
适合分治并行任务
自动负载均衡
支持异步任务和递归任务

缺点：

不适合阻塞操作（会降低工作窃取效率）
任务粒度过小会增加调度开销
与传统 ThreadPoolExecutor 语义不同

适用场景：

分治算法（如归并排序）
递归并行任务
CPU 密集型并行计算
典型应用：并行流处理、大数据计算

工厂方法对比总结

工厂方法	核心线程数	最大线程数	工作队列	主要风险	适用场景
`newFixedThreadPool`	n	n	LinkedBlockingQueue（无界）	OOM（队列积压）	限流、稳定负载
`newCachedThreadPool`	0	MAX_VALUE	SynchronousQueue	OOM（线程爆炸）	短时任务、突发负载
`newSingleThreadExecutor`	1	1	LinkedBlockingQueue（无界）	OOM（队列积压）	顺序执行、事务操作
`newSingleThreadScheduledExecutor`	1	MAX_VALUE	DelayedWorkQueue	单点瓶颈	定时任务、顺序调度
`newScheduledThreadPool`	n	MAX_VALUE	DelayedWorkQueue	线程爆炸	并发定时任务
`newWorkStealingPool`	parallelism	parallelism	ForkJoinPool.WorkQueue	不适合阻塞任务	分治并行、CPU密集型

生产环境建议

根据 Java 并发实践专家的建议（基于 JSR-166 规范和 Javadoc）：

避免使用无界队列：生产环境应使用有界队列（如 ArrayBlockingQueue）或自定义拒绝策略
避免使用无界线程数：明确设置合理的最大线程数
为线程池命名：使用自定义 ThreadFactory 设置有意义的线程名称，便于问题排查
显式指定拒绝策略：根据业务需求选择合适的拒绝策略
监控线程池状态：通过 ThreadPoolExecutor 提供的监控方法跟踪活跃线程数、队列大小等指标

// 推荐的生产环境配置示例
ExecutorService executor = new ThreadPoolExecutor(
    10,                              // 核心线程数
    20,                              // 最大线程数
    60L, TimeUnit.SECONDS,           // 空闲线程存活时间
    new ArrayBlockingQueue<>(100),   // 有界队列
    Executors.defaultThreadFactory(), // 默认线程工厂，生产环境建议自定义
    new ThreadPoolExecutor.CallerRunsPolicy()  // 拒绝策略
);

// 自定义 ThreadFactory 示例（推荐）
ThreadFactory customThreadFactory = new ThreadFactory() {
    private final AtomicInteger threadNumber = new AtomicInteger(1);
    private final String namePrefix = "worker-";

    @Override
    public Thread newThread(Runnable r) {
        Thread t = new Thread(r, namePrefix + threadNumber.getAndIncrement());
        t.setDaemon(false);  // 非守护线程
        t.setPriority(Thread.NORM_PRIORITY);
        t.setUncaughtExceptionHandler((thread, throwable) -> {
            // 自定义异常处理逻辑
            System.err.println("线程 " + thread.getName() + " 发生异常: " + throwable.getMessage());
        });
        return t;
    }
}    

    // 使用自定义 ThreadFactory 的完整配置
    ExecutorService productionExecutor = new ThreadPoolExecutor(
        10,
        20,
        60L, TimeUnit.SECONDS,
        new ArrayBlockingQueue<>(100),
        customThreadFactory,
        new ThreadPoolExecutor.CallerRunsPolicy()
    );

包装方法：unconfigurableExecutorService

Executors 还提供了一组包装方法，用于将任意线程池转换为不可配置的视图：

1
2

public static ExecutorService unconfigurableExecutorService(ExecutorService executor)
public static ScheduledExecutorService unconfigurableScheduledExecutorService(ScheduledExecutorService executor)

设计目的：

安全性：将线程池暴露给不可信代码时，防止调用者通过强转为 ThreadPoolExecutor 后修改核心参数（线程数、队列、拒绝策略等）
API 边界保护：库/框架作者可向调用者提供线程池实例，同时保留配置控制权

典型场景：

// 框架内部创建并配置线程池
ThreadPoolExecutor internalPool = new ThreadPoolExecutor(
    4, 8, 60L, TimeUnit.SECONDS, new LinkedBlockingQueue<>(100));

// 暴露给外部使用，但禁止修改配置
public ExecutorService getExecutor() {
    return Executors.unconfigurableExecutorService(internalPool);
}

调用者拿到的实例无法强转为 ThreadPoolExecutor，只能使用 ExecutorService 接口定义的方法。框架内部仍持有原始引用，可按需调整配置。

与 newSingleThreadExecutor 的关系：unconfigurableExecutorService 返回 DelegatedExecutorService，而 newSingleThreadExecutor 返回其子类 FinalizableDelegatedExecutorService（增加了 finalize 自动关闭）

构造器 vs 工厂方法：选择依据

阿里巴巴代码规范要求强制使用 ThreadPoolExecutor 构造器创建线程池，禁止使用 Executors 工厂方法。这一规范的核心依据在于：

默认配置陷阱：工厂方法的预设参数（尤其是无界队列容量 Integer.MAX_VALUE 和无界最大线程数 Integer.MAX_VALUE）可能在生产环境中导致资源耗尽（OOM 或线程爆炸）
强制思考原则：构造器强制开发者在实例化时必须明确指定核心参数（队列容量、最大线程数、拒绝策略），而非依赖隐式默认值

然而，这一规范并非要求我们完全摒弃工厂方法。选择何种创建方式，应当基于具体线程池类型的语义特征做出判断。

ThreadPoolExecutor：优先使用构造器

对于通用目的的线程执行器，强烈建议使用构造器。理由如下：

核心线程数和最大线程数需要根据业务负载特征（CPU 密集型 vs IO 密集型）精心配置，依赖默认值往往意味着未经思考的决策
队列容量必须设置上限，防止任务积压导致 OutOfMemoryError
拒绝策略直接影响系统的容错行为和降级能力，需要显式选择而非接受默认的 AbortPolicy

// 生产环境推荐写法
ExecutorService executor = new ThreadPoolExecutor(
    corePoolSize,      // 根据负载特征计算
    maxPoolSize,       // 必须设置上限
    keepAliveTime, TimeUnit.SECONDS,
    new ArrayBlockingQueue<>(queueCapacity),  // 必须有界
    customThreadFactory,
    rejectionPolicy
);

ScheduledThreadPoolExecutor：可以使用工厂方法

对于定时任务调度器，在大多数场景下工厂方法是可接受的选择，理由如下：

DelayedWorkQueue 与 LinkedBlockingQueue 本质相同，内部数组按需翻倍扩容，上限为 Integer.MAX_VALUE，并非有界队列
真正的原因在于定时任务与普通任务的本质差异：
- 定时任务的提交频率由业务逻辑控制（如每日凌晨批量处理、每小时执行一次），而非由用户请求触发
- 用户对延时任务积压的容忍度远高于实时任务——队列中积压1000条待执行的定时任务通常可接受（它们只是在等待各自的延迟时间到期），而普通任务积压1000条则意味着系统已过载
- 定时任务的单次提交量通常较小，即使在大业务量系统中，单次调度请求也往往是数十至数百条级别，而非无限制地提交
ScheduledThreadPoolExecutor 的核心线程数通常较小（通常为 CPU 核数），即使队列积压，线程数的增长也受限于任务执行时长

关键区分：DelayedWorkQueue 的"无界"风险与 LinkedBlockingQueue 的"无界"风险完全相同。在高频调度场景下（如每秒数千次调度请求），同样可能导致 OOM。因此：

低频调度场景（每秒任务数 < 100）：工厂方法可接受
高频调度场景：应使用构造器，配置有界队列和合理的拒绝策略

尽管如此，在高可靠性要求的系统中，仍推荐使用构造器进行精细化配置：

// 更精细的配置（推荐用于关键业务系统）
ScheduledExecutorService scheduler = new ScheduledThreadPoolExecutor(
    corePoolSize,
    new CustomThreadFactory("scheduler-"),
    new ScheduledThreadPoolExecutor.DiscardOldestPolicy()
);

ForkJoinPool：通用并行任务用工厂方法，递归分治任务用构造器

ForkJoinPool 最初确实是为递归分治任务设计的（默认 LIFO 模式利于缓存局部性），但其工作窃取机制的应用范围已扩展到更广泛的并行任务场景。

Executors.newWorkStealingPool() 工厂方法适用于非递归的通用并行任务：

默认并行度 Runtime.getRuntime().availableProcessors() 正是该池设计的核心目标——充分利用系统 CPU 资源
内部传入 asyncMode = true（FIFO 模式），适合非递归的并行任务调度
工作窃取算法会自动平衡负载，过度手动调优往往适得其反

关键区分：执行递归分治任务（如归并排序、树遍历、深度优先搜索）时，应使用 ForkJoinPool 构造器并指定 asyncMode = false（LIFO 模式）。LIFO 模式使子任务在同一个线程中顺序执行，减少线程切换开销；FIFO 模式则让任务更均匀地分配到各个线程，减少长任务阻塞短任务的风险。

当存在以下特定需求时，应直接使用 ForkJoinPool 构造器：

需要 LIFO 模式（asyncMode = false）处理递归分治任务（如归并排序、树遍历）时，LIFO 利于缓存局部性
需要自定义线程工厂以设置特定线程属性（如守护线程状态、优先级）
需要限制最大线程数以控制资源占用（虽然通常不推荐，但某些隔离场景需要）

// 场景1：递归分治任务，需要 LIFO 模式
ForkJoinPool forkJoinPool = new ForkJoinPool(
    parallelism,
    ForkJoinPool.defaultForkJoinWorkerThreadFactory,
    null,
    false  // LIFO 模式，适合递归任务
);

// 场景2：需要自定义线程工厂
ForkJoinPool customPool = new ForkJoinPool(
    parallelism,
    customThreadFactory,
    handler,
    true   // FIFO 模式
);

newCachedThreadPool vs newFixedThreadPool：选择依据

这两个工厂方法均不推荐在生产环境直接使用，原因已在工厂方法对比总结中详述：

newFixedThreadPool 使用无界 LinkedBlockingQueue，队列积压会导致 OOM
newCachedThreadPool 使用 Integer.MAX_VALUE 作为最大线程数，可能导致线程爆炸

如需使用二者之一，应通过 ThreadPoolExecutor 构造器手动配置：

// 替代 newFixedThreadPool：有界队列 + 固定线程数
ExecutorService fixedExecutor = new ThreadPoolExecutor(
    nThreads, nThreads,
    0L, TimeUnit.MILLISECONDS,
    new ArrayBlockingQueue<>(capacity),  // 有界队列
    threadFactory,
    new AbortPolicy()
);

// 替代 newCachedThreadPool：有界队列 + 有界最大线程数
ExecutorService cachedExecutor = new ThreadPoolExecutor(
    0, maxThreads,  // 核心线程为0，有界最大线程
    60L, TimeUnit.SECONDS,
    new SynchronousQueue<>(),  // 无容量，直接传递
    threadFactory,
    new AbortPolicy()
);

二者的选择依据：任务特征

任务特征	推荐
任务量稳定可预测，期望限制并发数	`newFixedThreadPool`（或等效构造器）
任务量波动大，存在明显空闲期	`newCachedThreadPool`（或等效构造器）
任何生产环境	均使用构造器，明确配置队列容量和线程数上限

总结

线程池类型	推荐创建方式	核心理由
`ThreadPoolExecutor`（通用）	构造器	队列容量和线程数必须有界，拒绝策略必须显式
`newCachedThreadPool` / `newFixedThreadPool`	不推荐	使用构造器替代，明确配置资源上限
`ScheduledThreadPoolExecutor`	工厂方法（低频调度）或构造器（高频调度）	调度频率通常可控，但高频场景需构造器配置有界队列
`ForkJoinPool`	工厂方法（默认），构造器（特定场景）	并行度应匹配 CPU 核心数，LIFO 模式需手动指定

阿里巴巴代码规范的真正目的不是"禁止工厂方法"，而是"强制开发者思考关键配置"。当我们充分理解了每种线程池类型的行为特征后，选择工厂方法或构造器就成为了一种有意识的工程决策，而非盲从或规避。

线程组

线程组提供一个“集合”，可以把一群线程归于一处，可以批量 interrupt/stop/suspend。
但这个方案是很危险的，使用线程池和并发安全的 Collection 都可以管理好线程。

原本设计目的

资源管理：将相关线程组织在一起，便于批量操作
安全隔离：不同线程组可以有不同的安全策略
异常处理：提供组级别的未捕获异常处理
层次结构：支持线程组的嵌套（parent-child关系）

缺陷

API设计不一致且不完整
线程安全问题
功能缺失
安全模型过时

替代方案

Executor框架
CompletableFuture
ForkJoinPool

官方态度

Java 16+：ThreadGroup 的多个方法（stop/suspend/resume/destroy/isDaemon/setDaemon/checkAccess 等）标记为 @Deprecated(forRemoval = true)
JEP 411：废弃 Security Manager，线程组的安全相关方法失去存在意义
OpenJDK 邮件列表：多次讨论完全移除线程组

CompletionStage

这是定义“可能是”异步计算的一个阶段，可能被其他阶段触发，也可以触发其他阶段。它是 CompletableFuture 的父接口。

它有一个特点，大量非 void 方法返回值都是 CompletionStage 类型，这样既允许 builder 模式，也允许各种 transformation 模式。

CompletableFuture

线程池的超时中断机制

1	`invokeAll(tasks, 300L, TimeUnit.MILLISECONDS);`

会让这个类型中断提前返回：

432369-Caused by: java.lang.InterruptedException: null
432370- at java.util.concurrent.CompletableFuture.reportGet(CompletableFuture.java:347)
432371- at java.util.concurrent.CompletableFuture.get(CompletableFuture.java:1915)
432372- at org.apache.dubbo.rpc.AsyncRpcResult.get(AsyncRpcResult.java:196)
432373- at org.apache.dubbo.rpc.protocol.AbstractInvoker.waitForResultIfSync(AbstractInvoker.java:266)
432374- at org.apache.dubbo.rpc.protocol.AbstractInvoker.invoke(AbstractInvoker.java:186)
432375- at org.apache.dubbo.rpc.cluster.support.AbstractClusterInvoker.invokeWithContext(AbstractClusterInvoker.java:379)
432376- at org.apache.dubbo.rpc.cluster.support.FailoverClusterInvoker.doInvoke(FailoverClusterInvoker.java:81)

小技巧

如何处理任务超时问题

方法1：使用 FutureTask 的实现

    Future<Map<String, Object>> future = executor.submit(() -> getFeatures(context, zeusSceneId));
            try {
                // 穷人版超时：最简单的超时不是使用 circuit breaker，而是使用 FutureTask 的缺省超时实现，这个方案取不到值的时候底层会返回 TimeoutException，只要捕获这个超时就可以走入 fallback 逻辑
                features.putAll(future.get(paramCollectTimeout, TimeUnit.MILLISECONDS));
            } catch (InterruptedException | ExecutionException | TimeoutException e) {
                // fallback logic
            }
            
    // 其中 FutureTask 的实现是：
    public V get(long timeout, TimeUnit unit)
        throws InterruptedException, ExecutionException, TimeoutException {
        if (unit == null)
            throw new NullPointerException();
        int s = state;
        // 等待结束后抛出异常而不是空指针，否则调用 report 方法
        if (s <= COMPLETING &&
            (s = awaitDone(true, unit.toNanos(timeout))) <= COMPLETING)
            throw new TimeoutException();
        return report(s);
    }
    
// 以下为简化的伪代码示意（实际实现使用 LockSupport.parkNanos）：
其中超时底层的最简单实现是：

    public V get(long timeout, TimeUnit unit) throws InterruptedException, ExecutionException, TimeoutException {
    long nanos = unit.toNanos(timeout);
    long deadline = System.nanoTime() + nanos;
    
    // 循环等待，直到任务完成或超时
    while (state <= COMPLETING) {
        long remaining = deadline - System.nanoTime();
        if (remaining <= 0L) {
            throw new TimeoutException();  // 超时了
        }
        LockSupport.parkNanos(this, remaining);  // 等待指定时间
    }
    
    return report(state);  // 返回结果
}

方法2：使用条件变量

// 发出调用
condition.await
// 非阻塞地调用 isDone 方法，抛出异常或取值
// 这是方法1 的泛化实现

方法3：使用 countDownLatch/CyclicBarrier

1
2
3

// 发出调用
无锁的 await
// 非阻塞地调用 isDone 方法，抛出异常或取值，但要注意其他线程对 done 状态的维护

这个方法不需要依赖于 ReentrantLock，是通过纯 AQS 实现的，见 CountDownLatch 源码。

自定义线程池实现自定义中断

待补充

Java 异步执行中的异常处理与线程生命周期

从 FutureTask、AsyncUncaughtExceptionHandler 到 UncaughtExceptionHandler

在 Java 并发和 Spring 异步执行模型中，异常处理涉及多个抽象层级：
JVM 线程模型、JDK 并发工具以及 Spring 框架本身。

这些层级各自对异常承担不同职责，但它们的行为经常被混淆，典型问题包括：

异步任务抛出的异常为何没有日志
UncaughtExceptionHandler 在线程池中为何不生效
AsyncUncaughtExceptionHandler 是否会影响线程生命周期

本文从线程是否终止这一确定性问题出发，系统梳理三种机制的边界与协作方式。

一、线程是否终止的唯一判定标准

在 JVM 层面，线程是否终止只取决于一个条件：

是否存在未被捕获、并逃逸出 Thread.run() 的 Throwable。从这个 run 出去以后，就进入 jvm 的cpp 代码的接管范围

这一规则与使用何种框架无关。

会导致线程终止的情况

1
2
3

new Thread(() -> {
    throw new RuntimeException("error");
}).start();

执行结果：

异常未被捕获
异常逃逸出 run()
JVM 调用 UncaughtExceptionHandler
线程终止

源码位置：Thread 的实现
还可以参考这个：《01.崩溃捕获设计实践方案 crash方案》

void JavaThread::exit(bool destroy_vm) {
    if (has_pending_exception()) {
        Handle exception(this, pending_exception());
        clear_pending_exception();
        
        // 直接内联处理，无单独 uncaught_exception 方法
        if (threadObj() != NULL) {
            Klass* klass = SystemDictionary::Thread_klass();
            // ... 通过 JNI 调用 Java 层 uncaughtException
            JavaCalls::call_virtual(&result, klass, 
                                   vmSymbols::uncaughtException_name(),
                                   vmSymbols::thread_throwable_void_signature(),
                                   &args, this);
        }
    }
}

sequenceDiagram
    participant JVM as JVM(C++)
    participant JavaThread as JavaThread(C++)
    participant ThreadJava as java.lang.Thread
    
    JVM->>JavaThread: 线程执行中抛出异常
    JavaThread->>JavaThread: set_pending_exception(exception)
    JVM->>JavaThread: 线程退出调用 exit()
    JavaThread->>JavaThread: has_pending_exception()
    JavaThread->>JavaThread: 直接在 exit() 中处理
    JavaThread->>ThreadJava: JNI call_virtual("uncaughtException")
    ThreadJava->>ThreadJava: 实际调用 java.lang.Thread.uncaughtException
    ThreadJava->>ThreadJava: dispatchUncaughtException(e)
    ThreadJava->>ThreadGroup: getUncaughtExceptionHandler()
    ThreadGroup->>SystemErr: 默认处理

不会导致线程终止的情况

new Thread(() -> {
    try {
        throw new RuntimeException("error");
    } catch (Exception e) {
        // handled
    }
}).start();

执行结果：

异常被捕获
JVM 不介入
线程继续运行

结论：

异常是否被捕获，决定了线程是否终止；
异常由谁处理，并不决定线程生死。

二、FutureTask 对异常传播路径的改变

理解线程池与 Spring 异步行为，必须先理解 FutureTask。

execute 与 submit 的根本差异

1 2	`executor.execute(runnable); executor.submit(callable);`

差异不在返回值，而在执行结构：

execute：Runnable直接在线程中执行
submit：任务先被包装为FutureTask，再执行

FutureTask 中的异常拦截点

FutureTask.run() 的核心逻辑如下（简化）：

public void run() {
    try {
        callable.call();
    } catch (Throwable ex) {
        setException(ex);
    }
}

关键点：

Throwable 被主动捕获
异常不会逃逸出 run()
JVM 不认为线程发生未捕获异常
线程不会终止

异常在这里已经脱离“线程异常”的语义。

异常如何被重新抛出：report()

异常并未消失，而是作为执行结果存储：

1 2	`outcome = ex; state = EXCEPTIONAL;`

在调用Future.get()时：

private V report(int s) throws ExecutionException {
    Object x = outcome;
    if (s == NORMAL)
        return (V) x;
    throw new ExecutionException((Throwable) x);
}

report()的职责是：

将“执行结果状态”翻译为 Java 异常语义
将原始异常包装为 ExecutionException

结论：

FutureTask 将异常从“线程控制流”转移为“任务结果数据”。

三、UncaughtExceptionHandler 的职责边界

触发条件

UncaughtExceptionHandler仅在以下条件满足时被调用：

异常未被捕获
异常逃逸出Thread.run()
线程即将终止

JVM 调用顺序为：

Thread 自身的 handler
ThreadGroup
DefaultUncaughtExceptionHandler
JVM 默认 stderr

能力与限制

UncaughtExceptionHandler：

无法阻止线程终止
无法恢复线程执行
仅用于日志、告警等系统级兜底

在线程池中，只有 execute()且异常未被捕获时，才可能触发该 handler。

四、Spring AsyncUncaughtExceptionHandler 的作用范围

适用条件

Spring 明确限定：

仅处理 @Async 标注的 void 方法
不处理返回 Future / CompletableFuture 的方法

@Async
public void asyncTask() {
    throw new RuntimeException("error");
}

Spring 的异常拦截方式

Spring 在异步调用边界处捕获异常：

try {
    invokeMethod();
} catch (Throwable ex) {
    asyncUncaughtExceptionHandler.handle(ex, method, params);
}

对线程生命周期的影响

AsyncUncaughtExceptionHandler：

不会阻止线程终止
也不会导致线程终止

原因是：

异常已经被 Spring 捕获
JVM 无法感知未捕获异常
线程本身没有死亡条件

结论：

AsyncUncaughtExceptionHandler 只影响异常的业务处理路径，不影响线程生命周期。

五、三种异常路径的对比

@Async void 方法

@Async
public void task() {
    throw new RuntimeException();
}

异常路径：

方法执行
 → Spring 捕获
 → AsyncUncaughtExceptionHandler
 → 线程继续运行

线程池`execute`

1
2
3

executor.execute(() -> {
    throw new RuntimeException();
});

异常路径：

Runnable.run
 → 异常逃逸
 → JVM
 → UncaughtExceptionHandler
 → 线程终止

线程池 submit

1
2
3

Future<?> future = executor.submit(() -> {
    throw new RuntimeException();
});

异常路径：

FutureTask.run
 → catch Throwable
 → 异常存入 Future
 → get() 时抛 ExecutionException

六、两种 Handler 的推荐使用方式

AsyncUncaughtExceptionHandler（业务层）

@Configuration
@EnableAsync
public class AsyncConfig implements AsyncConfigurer {

    @Override
    public AsyncUncaughtExceptionHandler getAsyncUncaughtExceptionHandler() {
        return (ex, method, params) -> {
            log.error("Async void method failed: {}", method.getName(), ex);
        };
    }
}

适用场景：

@Async void 方法
业务补偿、告警、日志

UncaughtExceptionHandler（系统层）

ThreadFactory factory = r -> {
    Thread t = new Thread(r);
    t.setUncaughtExceptionHandler((thread, ex) -> {
        log.error("Thread {} terminated", thread.getName(), ex);
    });
    return t;
};

ExecutorService executor = new ThreadPoolExecutor(
    4, 8, 60, TimeUnit.SECONDS,
    new LinkedBlockingQueue<>(),
    factory
);

适用场景：

execute()执行的任务
系统级兜底监控

有返回值的异步任务

CompletableFuture
    .supplyAsync(this::work, executor)
    .exceptionally(ex -> {
        log.error("Async failed", ex);
        return null;
    });

必须显式消费异常，否则异常不会被观察到。

结论

线程是否终止，仅由异常是否逃逸到 JVM 决定
FutureTask 和 Spring 已在更高层捕获异常，因此不会触发 JVM 机制
AsyncUncaughtExceptionHandler 不控制线程生死，仅提供业务回调
UncaughtExceptionHandler 只用于处理线程终止前的系统级事件

Spring 的异步支持

如果只是@EnableAsync，Spring 会创建一个默认的 SimpleAsyncTaskExecutor（注意不是 ThreadPoolTaskExecutor）：
- 每个任务都会创建新线程
- 没有线程池复用
- 性能较差，不适合生产环境
在这个基础上，再实现AsyncConfigurer.getAsyncExecutor()就可以让自己的线程池替代框架的 Bean。

ThreadPoolTaskExecutor

ThreadPoolTaskExecutor 是 ExecutorConfigurationSupport 的子类，也包装了一个 ThreadPoolExecutor。

ExecutorConfigurationSupport 作为基类提供了：
- 生命周期管理：实现了 InitializingBean, DisposableBean
- 配置管理：线程工厂、拒绝策略、优雅关闭等配置
- 模板方法：定义了初始化和销毁的标准流程

特别是：

@Override
public void afterPropertiesSet() {
    initialize();
}

public void initialize() {
    if (this.logger.isInfoEnabled()) {
        this.logger.info("Initializing ExecutorService " + (this.beanName != null ? " '" + this.beanName + "'" : ""));
    }
    
    if (!this.threadNamePrefixSet && this.beanName != null) {
        this.setThreadNamePrefix(this.beanName + "-");
    }
    
    // 调用子类的具体实现
    this.executor = this.initializeExecutor(this.threadFactory, this.rejectedExecutionHandler);
}

所以在这个 bean 被使用以前，内部线程池要经过一个 afterPropertiesSet 驱动进行初始化和注入这个 ThreadPoolTaskExecutor 线程池外壳。

ThreadPoolTaskExecutor 内部线程池的替换

推荐：使用初始化器装饰

initializeExecutor 初始化过程里会允许我们装饰这个线程池：

@Override
protected ExecutorService initializeExecutor(
        ThreadFactory threadFactory, RejectedExecutionHandler rejectedExecutionHandler) {

    BlockingQueue<Runnable> queue = createQueue(this.queueCapacity);

    ThreadPoolExecutor executor;
    if (this.taskDecorator != null) {
        executor = new ThreadPoolExecutor(
                this.corePoolSize, this.maxPoolSize, this.keepAliveSeconds, TimeUnit.SECONDS,
                queue, threadFactory, rejectedExecutionHandler) {
            @Override
            public void execute(Runnable command) {
                Runnable decorated = taskDecorator.decorate(command);
                if (decorated != command) {
                    decoratedTaskMap.put(decorated, command);
                }
                super.execute(decorated);
            }
        };
    }
    else {
        executor = new ThreadPoolExecutor(
                this.corePoolSize, this.maxPoolSize, this.keepAliveSeconds, TimeUnit.SECONDS,
                queue, threadFactory, rejectedExecutionHandler);

    }

    if (this.allowCoreThreadTimeOut) {
        executor.allowCoreThreadTimeOut(true);
    }

    this.threadPoolExecutor = executor;
    return executor;
}

java 线程池的装饰逻辑就是只覆盖一个public void execute(Runnable command)即可。

这个方法本质上是一切线程池外部提交/执行操作的入口，所以它的执行线程是外部线程而已不是工作线程。

可以说这个壳的其他方法都只是包装一下普通线程的成员方法，但是这个 initializeExecutor 和 decorate 是这个壳特有的，是它存在的意义。

所有外部 command 在执行前都要被 decorate 一下，而且存在 decoratedTaskMap 里，模式是装饰后->原始命令。目前这个map没有用处，未来可能在用修饰后的任务找原始 Runnable 的时候会有用。

其他代理

其他方法都是用类似的模式来代理的，而且不支持多态：

@Override
public void execute(Runnable task) {
    Executor executor = getThreadPoolExecutor();
    try {
        executor.execute(task);
    }
    catch (RejectedExecutionException ex) {
        throw new TaskRejectedException("Executor [" + executor + "] did not accept task: " + task, ex);
    }
}

如果我们要替换线程池实现

我们只能用反射来替换：

@Bean("bizCommonTaskExecutor")
@Override
public ThreadPoolTaskExecutor getAsyncExecutor() {
    // 创建支持EagleEye上下文传递的ThreadPoolTaskExecutor
    ThreadPoolTaskExecutor taskExecutor = new ThreadPoolTaskExecutor() {
        @Override
        protected ThreadPoolExecutor initializeExecutor(
                ThreadFactory threadFactory,
                RejectedExecutionHandler rejectedExecutionHandler) {
            // 创建阻塞队列
            BlockingQueue<Runnable> queue = new LinkedBlockingQueue<>(QUEUE_CAPACITY);
            
            // 创建支持EagleEye上下文传递的线程池
            EagleEyeContextAwareThreadPoolExecutor executor = new EagleEyeContextAwareThreadPoolExecutor(
                CORE_POOL_SIZE,
                MAX_POOL_SIZE,
                KEEP_ALIVE_SECONDS,
                TimeUnit.SECONDS,
                queue,
                threadFactory,
                rejectedExecutionHandler
            );

            // 使用反射将executor赋值给父类的private threadPoolExecutor字段，这是目前唯一的方法
            try {
                java.lang.reflect.Field field = ThreadPoolTaskExecutor.class.getDeclaredField("threadPoolExecutor");
                field.setAccessible(true);
                field.set(this, executor);
                // 如果有必要，要存储老的 accessible，在 set 完了以后要还原
            } catch (Exception e) {
                LoggerUtils.error(LOGGER, "Failed to set threadPoolExecutor via reflection", e);
            }
            
            return executor;
        }
    };
    
    // 配置线程名前缀
    taskExecutor.setThreadNamePrefix("bd-common-async-");
    
    // 配置优雅停机
    taskExecutor.setWaitForTasksToCompleteOnShutdown(true);
    taskExecutor.setAwaitTerminationSeconds(AWAIT_TERMINATION_SECONDS);
    
    return taskExecutor;
}

我们不推荐使用这种做法，除非我们真的有增强 execute 以外的诉求。

对线程池实行 trace 传递

如果使用统一包装器

// 这个方法的第一层参数是 ThreadPoolTaskExecutor 的 execute 执行的时候的这个 command：
//              public void execute(Runnable command) {
//                  Runnable decorated = taskDecorator.decorate(command);
 taskExecutor.setTaskDecorator(runnable -> {
            
            // 这里获取外部提交的时候的线程和上下文
            final Object rpcContext = EagleEye.currentRpcContext();
            final Thread submitThread = Thread.currentThread();
            
            // 这里返回一个 runnable，给外部的 super.execute(decorated); 使用，这个方法就是原始线程池的 execute 了
            return () -> {
                // 这里开始执行的时候通常已经进入线程池的 worker 内部了
                
                // 当拒绝策略为 CallerRunsPolicy 且在提交线程中执行时，直接运行即可
                if (submitThread == Thread.currentThread()) {
                    runnable.run();
                    return;
                }
                
                boolean needClean = false;
                Object oldContext = EagleEye.currentRpcContext();
                try {
                    if (oldContext == null) {
                        needClean = true;
                        EagleEye.setRpcContext(rpcContext);
                    }
                    // 这是在内部线程 run 之前执行的围绕操作
                    runnable.run();
                } finally {
                    if (needClean) {
                        EagleEye.clearRpcContext();
                    }
                }
            };
        });

其中装饰器被调用的地方是就是上面的使用初始化器装饰。

本质上 executor 共有三个入口：

@Override
protected <T> RunnableFuture<T> newTaskFor(Runnable runnable, T value) {
    return new FutureTask<T>(runnable, value) {
        boolean needClean = false;
        final Object rpcContext = EagleEye.currentRpcContext();
        String gsid = GsidUtil.getGsid();
        @Override
        public void run() {
            if (EagleEye.currentRpcContext() == null) {
                needClean = true;
                EagleEye.setRpcContext(rpcContext);
            }
            GsidUtil.setGsid(gsid);
            try {
                super.run();
            } finally {
                if (needClean) {
                    EagleEye.clearRpcContext();
                }
                GsidUtil.clear();
            }
        }
    };
}

@Override
protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable) {
    return new FutureTask<T>(callable) {
        boolean needClean = false;
        final Object rpcContext = EagleEye.currentRpcContext();
        String gsid = GsidUtil.getGsid();
        @Override
        public void run() {
            if (EagleEye.currentRpcContext() == null) {
                needClean = true;
                EagleEye.setRpcContext(rpcContext);
            }
            GsidUtil.setGsid(gsid);
            try {
                super.run();
            } finally {
                if (needClean) {
                    EagleEye.clearRpcContext();
                }
                GsidUtil.clear();
            }
        }
    };
}

@Override
public void execute(Runnable command) {
    final Object rpcContext = EagleEye.currentRpcContext();
    String gsid = GsidUtil.getGsid();
    if (command instanceof FutureTask) {
        super.execute(command);
    } else {
        super.execute(() -> {
            EagleEye.setRpcContext(rpcContext);
            GsidUtil.setGsid(gsid);
            try {
                command.run();
            } finally {
                EagleEye.clearRpcContext();
                GsidUtil.clear();
            }
        });
    }
}

前两个 newTaskFor 是其他 submit 方法到 execute 之前的底层方法。因为前两个入口最终都会调到execute(Runnable command)，所以它的内部要避开if (command instanceof FutureTask) {的场景。这个设计因此显得比较累赘。

实际上 decorator 的实现就是最佳的，最终只要实现一个 execute 的包装提交就行了。

这个实现里有一个地方要注意：执行完当前的 runnable 需要 clear，否则可能会出现以前有的遗留 traceId 污染的问题。

参考资料：

异步编程的进化

本章节一部分来自于qwen，一部分来自于以下文章：

《CompletableFuture原理与实践-外卖商家端API的异步化》

演进本质

graph LR
    A[Java 5 Future] -->|阻塞痛点| B[Guava ListenableFuture]
    B -->|回调地狱| C[CompletableFuture]
    C -->|流处理需求| D[RxJava]
    D -->|Spring整合| E[Reactor]
    
    A -->|范式转变| F[命令式->声明式]
    B -->|抽象提升| G[事件驱动->数据流]
    C -->|能力增强| H[组合->背压]
    D & E -->|统一理念| I[异步即数据流]

控制流：阻塞等待 → 回调响应 → 声明式组合 → 响应式流
错误处理：分散try-catch → 回调onFailure → 链式exceptionally → 流式onError
组合能力：无 → 有限transform → 丰富组合操作符 → 完整流处理
背压支持：无 → 无 → 有限 → 完整内建支持

模式	核心特征	编程范式	适用场景
Java 5 Future	阻塞等待	命令式	简单异步任务，兼容性要求高
Guava ListenableFuture	回调驱动	事件驱动	中等复杂度，需要非阻塞回调
CompletableFuture	链式组合	声明式	复杂异步流程，需要组合和错误处理
RxJava	响应式流	函数式响应式	事件流处理，背压支持，复杂数据转换
Reactor	响应式流	函数式响应式	Spring生态，高性能流处理，背压内建

传统调用时序

Java 5 Future

%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#FFF5E1', 'edgeLabelBackground':'#FFF', 'fontFamily': 'monospace'}}}%%
sequenceDiagram
    participant Client as Client
    participant Executor as ExecutorService
    participant Future as Future<T>
    participant Task as Callable<T>

    Note over Client,Task: Java 5 Future (阻塞式)
    Client->>Executor: submit(Callable)
    Executor->>Future: 创建Future
    Executor-->>Client: 返回Future
    Note right of Client: 非阻塞返回

    Executor->>Task: 执行任务
    Task-->>Executor: 返回结果

    Client->>Future: get() / get(timeout)
    Note right of Client: 阻塞等待
    Future-->>Client: 返回结果或抛出异常
    Note over Client: 阻塞式: submit/get

// 核心特点：阻塞等待结果
ExecutorService executor = Executors.newSingleThreadExecutor();
Future<String> future = executor.submit(() -> {
    Thread.sleep(1000);
    return "Hello Future";
});

try {
    // [注意] 阻塞当前线程等待结果
    String result = future.get(2, TimeUnit.SECONDS);
    System.out.println(result);
} catch (TimeoutException e) {
    System.err.println("超时了!");
} finally {
    executor.shutdown();
}

Guava ListenableFuture

%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#D5E8D4', 'edgeLabelBackground':'#FFF', 'fontFamily': 'monospace'}}}%%
sequenceDiagram
    participant Client as Client
    participant Executor as ListeningExecutorService
    participant Future as ListenableFuture<T>
    participant Callback as FutureCallback<T>
    participant Task as Callable<T>

    Note over Client,Task: Guava ListenableFuture (回调式)
    Client->>Executor: submit(Callable)
    Executor->>Future: 创建ListenableFuture
    Executor-->>Client: 返回ListenableFuture
    Note right of Client: 非阻塞返回

    Client->>Future: addCallback(FutureCallback)
    Note right of Client: 注册回调，非阻塞

    Executor->>Task: 执行任务
    Task-->>Executor: 返回结果

    Future->>Callback: onSuccess(result) 或 onFailure(ex)
    Note over Client: 回调式: submit/addCallback

// 核心特点：回调处理结果
ListeningExecutorService executor = MoreExecutors.listeningDecorator(
    Executors.newSingleThreadExecutor()
);

ListenableFuture<String> future = executor.submit(() -> {
    Thread.sleep(1000);
    return "Hello ListenableFuture";
});

// [正确] 非阻塞：注册回调处理结果
Futures.addCallback(future, new FutureCallback<String>() {
    @Override
    public void onSuccess(String result) {
        System.out.println("成功: " + result);
    }
    @Override
    public void onFailure(Throwable t) {
        System.err.println("失败: " + t.getMessage());
    }
}, executor);

// [注意] 需要手动关闭executor
executor.shutdown();

这个方案是很容易产生回调地狱的，因为总是会有 addCallback + onSuccess 这种不可编排、组合 api 不适合把大型并发结果组合在一起的缺陷：

// 回调地狱示例
ListenableFuture<User> userFuture = userService.getUser(userId);

// 第一层回调
Futures.addCallback(userFuture, new FutureCallback<User>() {
    @Override
    public void onSuccess(User user) {
        // 第二层回调：需要 user 结果
        ListenableFuture<List<Order>> ordersFuture = orderService.getOrders(user.getId());
        
        Futures.addCallback(ordersFuture, new FutureCallback<List<Order>>() {
            @Override
            public void onSuccess(List<Order> orders) {
                // 第三层回调：需要 orders 结果
                ListenableFuture<List<Product>> productsFuture = 
                    productService.getProducts(orders.stream()
                        .map(Order::getProductId)
                        .collect(Collectors.toList()));
                
                Futures.addCallback(productsFuture, new FutureCallback<List<Product>>() {
                    @Override
                    public void onSuccess(List<Product> products) {
                        // 第四层回调：需要 products 结果
                        // 终于可以组装最终结果了...
                        OrderDetails details = new OrderDetails(user, orders, products);
                        log.info("订单详情: {}", details);
                    }
                    @Override
                    public void onFailure(Throwable t) {
                        log.error("Products retrieval failed", t);
                        auditService.logFailure("products", t);
                    }
                }, executor);
            }
            @Override
            public void onFailure(Throwable t) {
                log.error("Orders retrieval failed", t);
                auditService.logFailure("orders", t);
            }
        }, executor);
    }
    @Override
    public void onFailure(Throwable t) {
        log.error("User retrieval failed", t);
        auditService.logFailure("user", t);
    }
}, executor);

CompletableFuture

%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#DAE8FC', 'edgeLabelBackground':'#FFF', 'fontFamily': 'monospace'}}}%%
sequenceDiagram
    participant Client as Client
    participant CF1 as CompletableFuture<T>
    participant CF2 as CompletableFuture<U>
    participant Executor as Executor

    Note over Client,Executor: CompletableFuture (链式组合)
    Client->>CF1: supplyAsync(Supplier)
    CF1-->>Client: 返回CompletableFuture
    Note right of Client: 非阻塞返回

    Client->>CF1: thenApply(Function)
    CF1->>CF2: 创建新的CompletableFuture
    CF2-->>Client: 返回新的CompletableFuture
    Note right of Client: 链式组合，非阻塞

    Executor->>CF1: 执行任务
    CF1->>CF2: 传递结果
    CF2-->>Client: 完成时通知
    Note over Client: 链式: supplyAsync/thenApply/thenCompose

CompletableFuture 和 ListenableFuture 的设计哲学差异：

// ListenableFuture 设计哲学：
// "当异步操作完成时，通知我"
future.addCallback(new FutureCallback<T>() {
    void onSuccess(T result);    // 回调处理成功
    void onFailure(Throwable t); // 回调处理失败
});

// CompletableFuture 设计哲学：
// "将这个异步操作与下一个操作组合起来"
future.thenCompose(result -> nextOperation(result))
      .thenApply(transformed -> process(transformed))
      .exceptionally(ex -> handle(ex));

执行树

CompletableFuture执行树.png

核心 API

classDiagram
    class CompletableFuture~T~ {
        <<核心类>>
        +T result
        +Throwable exception
        +Object stack
        
        %% 创建方法
        +supplyAsync(Supplier~T~) CompletableFuture~T~
        +runAsync(Runnable) CompletableFuture~Void~
        +completedFuture(T) CompletableFuture~T~
        
        %% 转换方法
        +thenApply(Function) CompletableFuture~U~
        +thenApplyAsync(Function) CompletableFuture~U~
        +thenCompose(Function) CompletableFuture~U~
        
        %% 消费方法
        +thenAccept(Consumer) CompletableFuture~Void~
        +thenRun(Runnable) CompletableFuture~Void~
        
        %% 组合方法
        +thenCombine(CompletableFuture, BiFunction) CompletableFuture~V~
        +allOf(CompletableFuture...) CompletableFuture~Void~
        +anyOf(CompletableFuture...) CompletableFuture~Object~
        
        %% 异常处理
        +exceptionally(Function) CompletableFuture~T~
        +handle(BiFunction) CompletableFuture~U~
        +whenComplete(BiConsumer) CompletableFuture~T~
        
        %% 完成方法
        +complete(T) boolean
        +completeExceptionally(Throwable) boolean
        
        %% 获取结果
        +get() T
        +join() T
        +getNow(T) T
    }
    
    class CompletionStage~T~ {
        <<接口>>
        +thenApply(Function) CompletionStage~U~
        +thenCompose(Function) CompletionStage~U~
        +thenCombine(CompletionStage, BiFunction) CompletionStage~V~
        +exceptionally(Function) CompletionStage~T~
    }
    
    class Future~T~ {
        <<接口>>
        +get() T
        +get(long, TimeUnit) T
        +cancel(boolean) boolean
        +isDone() boolean
        +isCancelled() boolean
    }
    
    CompletableFuture ..|> CompletionStage : implements
    CompletableFuture ..|> Future : implements

使用原则

六大原则速览：

原则	核心要点	常见错误
一：传线程池	异步回调必须显式指定线程池	使用默认 commonPool
二：不吞异常	用 exceptionally/handle 处理异常	不调用 get/join 导致异常被吞
三：饱和策略	有界队列 + 合适拒绝策略	无界队列导致 OOM
四：异常处理	链末端统一处理，或用 handle	只处理部分异常
五：设超时	用 orTimeout 或 get(timeout)	永远阻塞
六：不阻塞回调	用 thenCompose 替代阻塞调用	回调中调用同步阻塞方法

原则一：异步回调要传线程池

// [错误] 不指定线程池，使用默认的ForkJoinPool.commonPool()
CompletableFuture.supplyAsync(() -> fetchData())
    .thenApply(data -> process(data))  // 可能在commonPool线程执行
    .thenAccept(result -> save(result)); // 可能在调用线程执行

// [正确] 明确指定线程池
ExecutorService ioExecutor = Executors.newFixedThreadPool(10);
ExecutorService cpuExecutor = Executors.newWorkStealingPool();

CompletableFuture.supplyAsync(() -> fetchData(), ioExecutor)
    .thenApplyAsync(data -> process(data), cpuExecutor)
    .thenAcceptAsync(result -> save(result), ioExecutor);

原则二：CompletableFuture 中不要吞异常

// [错误] 异常被吞掉，无法感知
CompletableFuture.supplyAsync(() -> {
    throw new RuntimeException("出错了");
}).thenApply(result -> result + "processed");
// 如果不调用get/join，异常永远不会被发现

// [正确] 使用exceptionally或handle处理异常
CompletableFuture.supplyAsync(() -> {
    throw new RuntimeException("出错了");
}).exceptionally(ex -> {
    log.error("任务执行失败", ex);
    return "默认值";
}).thenApply(result -> result + "processed");

// [更好] 使用whenComplete记录日志，不影响异常传播
CompletableFuture.supplyAsync(() -> {
    throw new RuntimeException("出错了");
}).whenComplete((result, ex) -> {
    if (ex != null) {
        log.error("任务执行失败", ex);
    }
});

原则三：自定义线程池时，注意饱和策略

// [错误] 使用无界队列，可能导致OOM
ExecutorService executor = new ThreadPoolExecutor(
    10, 10, 0L, TimeUnit.MILLISECONDS,
    new LinkedBlockingQueue<>()  // 无界队列
);

// [正确] 使用有界队列 + 合适的拒绝策略
ExecutorService executor = new ThreadPoolExecutor(
    10, 20, 60L, TimeUnit.SECONDS,
    new LinkedBlockingQueue<>(1000),
    new ThreadPoolExecutor.CallerRunsPolicy()  // 调用者执行策略
);

原则四：正确进行异常处理

// [错误] 只处理部分异常
CompletableFuture.supplyAsync(() -> fetchData())
    .thenApply(data -> process(data))
    .exceptionally(ex -> handleFetchError(ex));  // 只能处理fetchData的异常

// [正确] 在链的末端统一处理异常
CompletableFuture.supplyAsync(() -> fetchData())
    .thenApply(data -> process(data))
    .thenApply(result -> transform(result))
    .exceptionally(ex -> {
        // 处理整个链中的任何异常
        log.error("处理失败", ex);
        return defaultValue;
    });

// [更好] 使用handle同时处理结果和异常
CompletableFuture.supplyAsync(() -> fetchData())
    .thenApply(data -> process(data))
    .handle((result, ex) -> {
        if (ex != null) {
            log.error("处理失败", ex);
            return defaultValue;
        }
        return result;
    });

原则五：合理设置超时

// [错误] 没有超时控制
CompletableFuture<String> future = CompletableFuture.supplyAsync(() -> {
    // 可能永远阻塞
    return slowService.call();
});
String result = future.join();  // 可能永远阻塞

// [正确] Java 9+ 使用orTimeout
CompletableFuture<String> future = CompletableFuture.supplyAsync(() -> {
    return slowService.call();
}).orTimeout(5, TimeUnit.SECONDS);

// [正确] Java 8 使用get with timeout
try {
    String result = future.get(5, TimeUnit.SECONDS);
} catch (TimeoutException e) {
    future.cancel(true);
    // 处理超时
}

// [更好] 使用completeOnTimeout提供默认值 (Java 9+)
CompletableFuture<String> future = CompletableFuture.supplyAsync(() -> {
    return slowService.call();
}).completeOnTimeout("默认值", 5, TimeUnit.SECONDS);

CompletableFuture.allOf 的超时控制

CompletableFuture.allOf 提供了一种更现代的批量任务等待方式，其核心优势体现在以下几个方面：

统一异常处理

传统的 Future.get 方式需要对每个任务单独捕获异常：

// 传统方式：重复的 try-catch
for (Future<Response> future : futures) {
    try {
        future.get(3, TimeUnit.SECONDS);
    } catch (TimeoutException e) {
        log.error("Task timeout", e);
    } catch (ExecutionException e) {
        log.error("Task failed", e);
    }
}

而 CompletableFuture.allOf 可以通过调用链统一处理所有子任务的异常：

// 现代方式：统一的异常处理
CompletableFuture.allOf(completableFutures.toArray(new CompletableFuture[0]))
    .exceptionally(e -> {
        log.error("One or more tasks failed:", e);
        throw new RuntimeException(e);
    })
    .join();

这种方式的优势在于：

单一职责：异常处理逻辑集中在一处，易于维护
避免重复：不需要为每个任务写相同的 try-catch
声明式风格：通过函数式编程链表达"等待所有完成，统一处理异常"的意图

组合式编程

CompletableFuture.allOf 支持链式调用，可以轻松组合多个异步操作：

CompletableFuture.allOf(futures)
    .thenRun(() -> log.info("All tasks completed"))
    .exceptionally(e -> {
        log.error("Some tasks failed", e);
        return null;
    })
    .orTimeout(5, TimeUnit.SECONDS)  // 整体超时
    .join();

与 Future.get 的关键区别

维度	Future.get 逐个等待	CompletableFuture.allOf
等待策略	串行等待，总时间 = N x timeout	并行等待，总时间 = max(各任务时间)
异常处理	每个任务单独 try-catch	统一的 exceptionally 处理
超时语义	每个任务独立的超时	整体超时（所有任务的总时间）
代码风格	命令式，循环 + try-catch	声明式，链式调用
灵活性	可以中途退出（break/continue）	必须等待所有任务完成

注意事项

超时控制：allOf 本身不提供超时功能，需要配合 get(timeout) 或 orTimeout 使用
无法中途退出：一旦调用 allOf，必须等待所有任务完成（即使部分任务已经失败）
异常传播：任何一个子任务失败，allOf 都会失败，异常会被封装在 CompletionException 中

CompletableFuture.orTimeout 底层实现深入分析

CompletableFuture.orTimeout() 和 JavaScript 的 Promise.race + setTimeout 在表面上实现了相同的功能——为异步操作附加超时控制。但二者的底层机制截然不同，这种差异根植于两种语言完全不同的并发模型。

orTimeout 源码剖析

// Java: CompletableFuture.orTimeout 的底层实现 (JDK 9+, 简化)
public CompletableFuture<T> orTimeout(long timeout, TimeUnit unit) {
    if (unit == null) throw new NullPointerException();
    if (result == null)
        // Delayer 是一个静态内部类，持有一个 ScheduledThreadPoolExecutor
        // 本质上是向线程池提交了一个延迟任务
        whenComplete(new Canceller(
            Delayer.delay(new Timeout(this), timeout, unit)));
    return this;
}

// Delayer 的实现
static final class Delayer {
    // 守护线程池，全局共享，负责所有 CompletableFuture 的超时调度
    static final ScheduledThreadPoolExecutor delayer;
    static {
        delayer = new ScheduledThreadPoolExecutor(1, new DaemonThreadFactory());
        delayer.setRemoveOnCancelPolicy(true);
    }
    
    static ScheduledFuture<?> delay(Runnable command, long delay, TimeUnit unit) {
        return delayer.schedule(command, delay, unit);
    }
}

// Timeout 任务：超时后将 Future 以 TimeoutException 完成
static final class Timeout implements Runnable {
    final CompletableFuture<?> future;
    Timeout(CompletableFuture<?> future) { this.future = future; }
    public void run() {
        if (future != null && !future.isDone())
            future.completeExceptionally(new TimeoutException());
    }
}

与 JavaScript setTimeout 的对比

// JavaScript: Promise.race + setTimeout 的等价实现
function orTimeout(promise, timeoutMs) {
    const timeoutPromise = new Promise((_, reject) => {
        // setTimeout 将回调注册到事件循环的定时器队列
        // 由 libuv (Node.js) 或浏览器引擎的定时器机制管理
        setTimeout(() => {
            reject(new Error('TimeoutException'));
        }, timeoutMs);
    });
    
    return Promise.race([promise, timeoutPromise]);
}

二者的关键差异可以从以下维度理解：

graph TB
    subgraph Java["Java CompletableFuture.orTimeout"]
        J1["ScheduledThreadPoolExecutor<br/>(守护线程池，全局共享)"]
        J2["DelayQueue (最小堆)<br/>O(log n) 插入/取消"]
        J3["独立线程执行超时回调"]
        J4["多线程环境：需要 CAS/volatile<br/>保证 completeExceptionally 的线程安全"]
        J1 --> J2 --> J3 --> J4
    end
    
    subgraph JS["JavaScript setTimeout"]
        JS1["事件循环定时器队列<br/>(libuv / 浏览器引擎)"]
        JS2["红黑树或最小堆<br/>O(log n) 管理"]
        JS3["主线程在下一个 tick 执行回调"]
        JS4["单线程环境：天然无竞态<br/>无需同步原语"]
        JS1 --> JS2 --> JS3 --> JS4
    end
    
    style Java fill:#FFF3E0
    style JS fill:#FFFDE7

维度	Java `CompletableFuture.orTimeout`	JavaScript `Promise.race + setTimeout`
定时器实现	`ScheduledThreadPoolExecutor`（线程池 + DelayQueue）	事件循环内置定时器（libuv 红黑树 / 浏览器最小堆）
回调执行线程	ScheduledThreadPoolExecutor 的工作线程	主线程（事件循环的下一个 tick）
线程安全	需要 CAS 保证 `completeExceptionally` 的原子性	单线程，天然无竞态
取消机制	`Canceller` 在 Future 正常完成时取消定时任务；`setRemoveOnCancelPolicy(true)` 避免队列堆积	`clearTimeout` 从定时器队列移除；但 `Promise.race` 无法自动取消
精度	依赖 `ScheduledThreadPoolExecutor` 的调度精度（通常毫秒级）	依赖事件循环 tick 频率（通常毫秒级，但受主线程阻塞影响）
资源开销	全局共享 1 个守护线程 + DelayQueue 堆操作	零额外线程，定时器由运行时管理
任务真正取消	`orTimeout` 不会取消原始任务的执行线程	`setTimeout` 不会取消原始 `fetch` 请求

共同缺陷：超时不等于取消

无论是 Java 的 orTimeout 还是 JavaScript 的 Promise.race，超时后原始任务都不会被真正取消。Java 中 supplyAsync 提交的任务仍在线程池中运行；JavaScript 中 fetch 请求仍在进行网络 IO。要实现真正的取消，Java 需要配合 cancel(true) + 中断检查，JavaScript 需要使用 AbortController。

// Java: 正确的超时 + 取消模式
CompletableFuture<String> future = CompletableFuture.supplyAsync(() -> {
    // 任务内部必须检查中断
    while (!Thread.currentThread().isInterrupted()) {
        // 执行工作...
    }
    throw new CancellationException("interrupted");
});

future.orTimeout(3, TimeUnit.SECONDS)
      .whenComplete((result, ex) -> {
          if (ex instanceof TimeoutException) {
              future.cancel(true); // 尝试中断底层线程
          }
      });

本质差异：Java 的 CompletableFuture 是在多线程模型上构建的异步抽象，超时调度需要额外的线程池和同步机制；JavaScript 的 Promise 是在单线程事件循环上构建的异步抽象，超时调度由运行时内置的定时器队列完成，无需额外线程。二者在 API 层面趋于一致（都是"给异步操作附加超时"），但底层的复杂度差异巨大——这正是并发模型选择对上层 API 设计的深远影响。

原则六：避免在回调中阻塞

// [错误] 在回调中阻塞
CompletableFuture.supplyAsync(() -> fetchData())
    .thenApply(data -> {
        // 阻塞操作，会占用线程池线程
        return anotherService.syncCall(data);
    });

// [正确] 使用thenCompose处理嵌套的异步操作
CompletableFuture.supplyAsync(() -> fetchData())
    .thenCompose(data -> {
        // 返回新的CompletableFuture，不阻塞
        return CompletableFuture.supplyAsync(
            () -> anotherService.syncCall(data), 
            ioExecutor
        );
    });

完成保证原则

完成保证原则（Completion Guarantee Principle）是 CompletableFuture 编程中的一个核心设计模式，其核心思想是：

在调用 join() 或 get() 之前，确保目标 Future 已经完成，从而将阻塞操作转化为非阻塞的结果获取。

为什么需要完成保证原则？

// [问题] 直接调用join()会阻塞当前线程
CompletableFuture<String> future = CompletableFuture.supplyAsync(() -> {
    Thread.sleep(1000);
    return "result";
});
String result = future.join();  // 阻塞1秒

// [解决] 使用allOf确保完成后再join
CompletableFuture<Void> allDone = CompletableFuture.allOf(future);
allDone.thenApply(v -> {
    // 此时future已完成，join()立即返回，不阻塞
    return future.join();
});

完成保证原则的核心模式

// 模式：allOf() + thenApplyAsync() + join()
List<CompletableFuture<String>> futures = services.stream()
    .map(service -> CompletableFuture.supplyAsync(() -> service.call(), ioExecutor))
    .collect(Collectors.toList());

CompletableFuture<List<String>> resultFuture = CompletableFuture
    .allOf(futures.toArray(new CompletableFuture[0]))  // 1. 等待所有完成
    .thenApplyAsync(v -> {                              // 2. 完成后执行回调
        return futures.stream()
            .map(CompletableFuture::join)               // 3. join()不阻塞
            .collect(Collectors.toList());
    }, cpuExecutor);

完整示例

import java.util.concurrent.*;
import java.util.*;
import java.util.stream.*;

/**
 * 完成保证原则示例
 * 
 * 核心思想：在调用join()之前，确保Future已完成
 * 模式：allOf() + thenApplyAsync() + join()
 */
public class CompletionGuaranteeExample {

    public static void main(String[] args) {
        // 创建IO线程池（用于网络调用等IO密集型任务）
        ExecutorService ioPool = Executors.newFixedThreadPool(10, r -> {
            Thread t = new Thread(r, "io-pool-" + System.nanoTime());
            t.setDaemon(true);
            return t;
        });
        
        // 创建CPU线程池（用于结果聚合等CPU密集型任务）
        ExecutorService cpuPool = Executors.newFixedThreadPool(
            Runtime.getRuntime().availableProcessors(),
            r -> {
                Thread t = new Thread(r, "cpu-pool-" + System.nanoTime());
                t.setDaemon(true);
                return t;
            }
        );

        try {
            System.out.println("[" + Thread.currentThread().getName() + "] 开始执行");
            
            // 1. 创建多个异步任务（模拟30个服务调用）
            List<CompletableFuture<String>> serviceFutures = IntStream.range(0, 30)
                .mapToObj(i -> CompletableFuture.supplyAsync(() -> {
                    System.out.println("[" + Thread.currentThread().getName() + "] 调用服务 " + i);
                    simulateIoOperation(i);
                    return "result-" + i;
                }, ioPool))
                .collect(Collectors.toList());

            // 2. 应用完成保证原则：allOf() + thenApplyAsync() + join()
            CompletableFuture<List<String>> resultFuture = CompletableFuture
                .allOf(serviceFutures.toArray(new CompletableFuture[0])) // 等待所有完成
                .thenApplyAsync(v -> { // 所有future完成后才执行此回调
                    System.out.println("\n[正确] 原则验证: 所有服务调用已完成，开始聚合结果");
                    System.out.println("[" + Thread.currentThread().getName() + "] 聚合阶段启动（CPU密集型）");
                    
                    // 关键点：此处join() 100% 不阻塞！
                    List<String> results = serviceFutures.stream()
                        .map(future -> {
                            long start = System.nanoTime();
                            
                            // [要点] 完成保证原则核心：
                            // 由于 allOf() 确保所有 future 已完成，
                            // future.join() 直接返回内部存储的 result 字段
                            // 无锁竞争、无上下文切换、无阻塞
                            String result = future.join(); 
                            
                            long duration = System.nanoTime() - start;
                            System.out.printf(
                                "[%s] join() 耗时: %d ns, 结果: %s\n", 
                                Thread.currentThread().getName(), 
                                duration, 
                                result
                            );
                            
                            // [注意] 重要验证：join() 耗时应接近 0（通常 < 1000 ns）
                            // 如果耗时 > 10000 ns，说明存在阻塞（违反完成保证原则）
                            return result;
                        })
                        .collect(Collectors.toList());
                    
                    return results;
                }, cpuPool) // 显式指定CPU线程池，避免在IO线程执行计算
                .exceptionally(ex -> {
                    System.err.println("[" + Thread.currentThread().getName() + "] [错误] 全局异常: " + ex.getMessage());
                    return Arrays.asList("GLOBAL_FALLBACK");
                });

            // 3. 获取最终结果（末端阻塞，由主线程执行）
            List<String> results = resultFuture.join();
            System.out.println("\n最终聚合结果: " + results.size() + " 个结果");
            results.forEach(r -> System.out.println("  - " + r));

        } finally {
            ioPool.shutdown();
            cpuPool.shutdown();
        }
    }

    /**
     * 模拟IO操作（可变延迟）
     */
    private static void simulateIoOperation(int id) {
        try {
            // 不同服务不同延迟，模拟真实场景
            int delay = 50 + (id * 10) % 200;
            Thread.sleep(delay);
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
            throw new RuntimeException("IO操作被中断", e);
        }
    }
}

对传统的线程池的效率改进

CompletableFuture 相对于一般线程池的改进主要来自于对于复杂结果编排的 API 优化，本身并不提供性能优化。

如果要实现性能优化，可以

基于 Netty/NIO 实现了真正的异步 RPC：

发起调用后立即返回，不阻塞线程；
结果由 Netty 的 IO 线程（或专用回调线程）在数据到达时触发；
一个 IO 线程可同时管理成千上万个连接（C10K+）。

CompletableFuture 被用作"胶水层"：

将 NIO 回调封装为 CompletableFuture（如 toCompletableFuture 工具方法）；
用 thenCompose / allOf 等组合多个异步 RPC；
业务逻辑不再关心回调注册，只关注数据流依赖。

graph TD
    A["Client Request"] --> B["Inbound IO Thread<br>Netty EventLoop"]
    B --> C["Business Worker Thread<br>from biz-pool"]

    C --> d1["Create CF1 = new CompletableFuture()"]
    C --> d2["Create CF2 = new CompletableFuture()"]
    C --> d3["Create CF3 = new CompletableFuture()"]

    d1 --> e1["Register Observer1:<br>onSuccess → CF1.complete(...)<br>onFailure → CF1.completeEx(...)"]
    d2 --> e2["Register Observer2:<br>onSuccess → CF2.complete(...)<br>onFailure → CF2.completeEx(...)"]
    d3 --> e3["Register Observer3:<br>onSuccess → CF3.complete(...)<br>onFailure → CF3.completeEx(...)"]

    e1 --> f1["Call mtthrift.async(orderService, Observer1)"]
    e2 --> f2["Call mtthrift.async(productService, Observer2)"]
    e3 --> f3["Call mtthrift.async(deliveryService, Observer3)"]

    f1 --> g["Outbound IO Thread<br>Netty Client EventLoop"]
    f2 --> g
    f3 --> g

    g --> h1["(orderService)"]
    g --> h2["(productService)"]
    g --> h3["(deliveryService)"]

    h1 -->|Response| i1["Outbound IO Thread invokes<br>Observer1.onSuccess(result)"]
    h2 -->|Response| i2["Outbound IO Thread invokes<br>Observer2.onSuccess(result)"]
    h3 -->|Error| i3["Outbound IO Thread invokes<br>Observer3.onFailure(ex)"]

    i1 --> j1["CF1.complete(result)"]
    i2 --> j2["CF2.complete(result)"]
    i3 --> j3["CF3.completeExceptionally(ex)"]

    j1 --> k1["CF1.thenApplyAsync(enrichOrder, cpu-pool)"]
    j2 --> k2["CF2.thenApplyAsync(enrichProduct, cpu-pool)"]
    j3 --> k3["CF3.exceptionally(handleFallback)"]

    k1 --> l["CF4 = CF1.thenCombine(CF2, merge)"]
    k2 --> l
    k1 --> m["CompletableFuture.allOf(CF1..CF30)"]
    k2 --> m
    k3 --> m

    m --> n["m.thenApplyAsync(aggregateAll, cpu-pool)"]
    n --> o["Final Result"]
    o --> p["Write Response via Inbound IO Thread"]
    p --> q["Client"]

    classDef io fill:#d5e8d4,stroke:#82b366;
    classDef worker fill:#dae8fc,stroke:#6c8ebf;
    classDef outbound fill:#e1d5e7,stroke:#9673a6;
    classDef cf fill:#fff2cc,stroke:#d6b656;
    classDef service fill:#f8cecc,stroke:#b85450;
    classDef observer fill:#e6e6fa,stroke:#999;

    class B,p io
    class C,d1,d2,d3,e1,e2,e3,f1,f2,f3,k1,k2,k3,l,m,n worker
    class g,i1,i2,i3 outbound
    class j1,j2,j3,o cf
    class h1,h2,h3 service
    class e1,e2,e3 observer

Spring框架中的线程池实现与最佳实践

Spring线程池体系概述

Spring框架提供了多层次的线程池抽象，从底层的JDK线程池封装到高层的应用级线程池管理：

graph TD
    A[Spring线程池体系] --> B{抽象层级}
    B -->|底层封装| C[TaskExecutor接口]
    B -->|中层实现| D[ThreadPoolTaskExecutor]
    B -->|高层管理| E[TaskScheduler]
    B -->|应用集成| F[@Async注解支持]
    
    C --> G[SimpleAsyncTaskExecutor]
    C --> H[ConcurrentTaskExecutor]
    C --> I[ThreadPoolTaskExecutor]
    
    D --> J[配置属性]
    D --> K[生命周期管理]
    D --> L[监控指标]
    
    E --> M[定时任务]
    E --> N[Cron表达式]
    E --> O[延迟执行]

核心组件详解

TaskExecutor接口设计

/**
 * Spring的线程池抽象接口
 * 基于命令模式，提供统一的异步执行契约
 */
public interface TaskExecutor extends Executor {
    /**
     * 执行给定的Runnable任务
     * @param task 要执行的任务
     */
    void execute(Runnable task);
}

设计优势：

解耦了应用代码与具体线程池实现
提供了统一的异常处理机制
支持任务装饰器模式

ThreadPoolTaskExecutor实现

@Configuration
@EnableAsync
public class ThreadPoolConfig {
    
    @Bean
    public TaskExecutor taskExecutor() {
        ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();
        
        // 核心配置参数
        executor.setCorePoolSize(10);           // 核心线程数
        executor.setMaxPoolSize(50);            // 最大线程数
        executor.setQueueCapacity(200);         // 队列容量
        executor.setKeepAliveSeconds(60);       // 空闲线程存活时间
        
        // 线程命名和拒绝策略
        executor.setThreadNamePrefix("spring-task-");
        executor.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy());
        
        // 等待所有任务完成
        executor.setWaitForTasksToCompleteOnShutdown(true);
        executor.setAwaitTerminationSeconds(30);
        
        // 初始化线程池
        // 注意: initialize()会立即创建corePoolSize个线程
        // 如果希望延迟创建线程，可以设置:
        // executor.setAllowCoreThreadTimeOut(true);
        executor.initialize();
        return executor;
    }
}

与原生线程池的映射关系

Spring组件	JDK原生组件	配置映射
ThreadPoolTaskExecutor	ThreadPoolExecutor	1:1直接映射
SimpleAsyncTaskExecutor	ThreadFactory	每次创建新线程
ConcurrentTaskExecutor	ExecutorService	适配器模式

graph LR
    A[ThreadPoolTaskExecutor] --> B[ThreadPoolExecutor]
    A --> C[配置参数映射]
    
    C --> D[corePoolSize]
    C --> E[maxPoolSize]
    C --> F[keepAliveTime]
    C --> G[workQueue]
    
    B --> H[实际执行]

定时任务：ScheduledExecutorService vs Timer

为什么不推荐使用 Timer？

在 Java 5（2004年）引入 ScheduledExecutorService 之前，java.util.Timer 是实现定时任务的标准方式。但 Timer 有以下严重缺陷：

特性	Timer	ScheduledExecutorService
线程模型	单线程执行所有任务；异常后线程终止，无补偿机制	线程池支持并行；Worker异常退出后自动创建新线程补偿
异常处理	任何任务抛出异常会导致 Timer 线程终止，所有后续任务（含不相干任务）全部停止	异常隔离：周期任务异常后该任务停止调度，但不影响其他独立任务
时间精度	系统时钟敏感，受系统时间调整影响-所以使用的是墙上时钟	相对稳定，使用 `System.nanoTime()`，使用单调系统时钟
灵活性	仅支持 `schedule(TimerTask, delay)`、`schedule(TimerTask, delay, period)`、`scheduleAtFixedRate`	支持 `schedule(Callable)` 返回结果、`scheduleAtFixedRate`、`scheduleWithFixedDelay`、可配置 `RemoveOnCancelPolicy` 等
配置调整	创建后无法调整线程数等参数	支持动态调整 corePoolSize 等参数

Timer 的致命缺陷示例：

Timer timer = new Timer();

timer.scheduleAtFixedRate(new TimerTask() {
    @Override
    public void run() {
        System.out.println("Task 1 running");
        throw new RuntimeException("Task 1 failed");
    }
}, 0, 1000);

timer.scheduleAtFixedRate(new TimerTask() {
    @Override
    public void run() {
        System.out.println("Task 2 running");  // 永远不会执行！
    }
}, 0, 1000);

输出：

Task 1 running
Exception in thread "Timer-0" java.lang.RuntimeException: Task 1 failed
    at ...
Timer-0 线程终止，所有后续任务停止

ScheduledExecutorService 的正确行为：

ScheduledExecutorService executor = Executors.newScheduledThreadPool(2);

executor.scheduleAtFixedRate(() -> {
    System.out.println("Task 1 running");
    throw new RuntimeException("Task 1 failed");
}, 0, 1, SECONDS);

executor.scheduleAtFixedRate(() -> {
    System.out.println("Task 2 running");  // 仍然会执行！
}, 0, 1, SECONDS);

输出：

Task 1 running
Task 2 running
Task 2 running
... (Task 2 持续执行)

结论：永远不要在生产环境使用 Timer，它已经被 ScheduledExecutorService 完全取代。

Spring @Scheduled 的默认陷阱：单线程调度器

问题描述

在 Spring 中，@Scheduled 的执行由 TaskScheduler/ScheduledTaskRegistrar 驱动。未显式配置时，很多场景会退化到单线程调度器。

这是一个长期存在的坑，不同 Spring Boot 版本与配置路径略有差异：

Spring Boot 2.x: 默认使用单线程的 ConcurrentTaskScheduler
Spring Boot 3.x: 仍然是单线程，但提供了更好的配置支持（spring.task.scheduling.pool.size）
核心问题: 无论哪个版本，默认调度器线程池大小都是1，需要显式配置才能并行执行

但"默认不一定是你想要的并行度"是核心问题。

问题影响

结果：一个定时任务慢了，会拖住其他任务的触发/执行。

sequenceDiagram
    participant T1 as Task1 (慢任务)
    participant T2 as Task2 (正常任务)
    participant T3 as Task3 (正常任务)
    participant S as 单线程调度器
    
    Note over S: 默认配置：单线程
    S->>T1: 执行 Task1
    T1->>T1: 执行中...（耗时5秒）
    
    Note over T2,T3: Task2 和 Task3 等待
    T2--xS: 无法执行
    T3--xS: 无法执行
    
    T1->>S: 完成
    S->>T2: 执行 Task2
    T2->>S: 完成
    S->>T3: 执行 Task3
    T3->>S: 完成

正确做法：显式配置

方式一：实现 SchedulingConfigurer（最可控）

@Configuration
@EnableScheduling
public class SchedulingConfig implements SchedulingConfigurer {

    @Bean(destroyMethod = "shutdown")
    public ScheduledThreadPoolExecutor taskScheduler() {
        ScheduledThreadPoolExecutor exec = new ScheduledThreadPoolExecutor(4, r -> {
            Thread t = new Thread(r);
            t.setName("spring-scheduler-" + t.getId());
            t.setDaemon(false);
            return t;
        });
        exec.setRemoveOnCancelPolicy(true);
        // 注意: 以下配置会在shutdown时立即取消所有任务
        // 如果需要优雅关闭，考虑设置为true或配合waitForTasksToCompleteOnShutdown使用
        exec.setExecuteExistingDelayedTasksAfterShutdownPolicy(false);
        exec.setContinueExistingPeriodicTasksAfterShutdownPolicy(false);
        return exec;
    }

    @Override
    public void configureTasks(ScheduledTaskRegistrar taskRegistrar) {
        taskRegistrar.setScheduler(taskScheduler());

        // Spring 的错误处理钩子：防止异常导致任务静默停止/没人知道
        taskRegistrar.setErrorHandler(t ->
            System.err.println("scheduled task error: " + t)
        );
    }
}

对应的任务：

@Component
public class Jobs {

    @Scheduled(fixedDelayString = "2000")
    public void cleanup() {
        // 永远 catch，ErrorHandler 是兜底，不是主策略
        try {
            doCleanup();
        } catch (Throwable t) {
            // log + metrics
        }
    }
}

方式二：使用 ThreadPoolTaskScheduler（Spring 的包装）

@Bean
public ThreadPoolTaskScheduler threadPoolTaskScheduler() {
    ThreadPoolTaskScheduler ts = new ThreadPoolTaskScheduler();
    ts.setPoolSize(4);
    ts.setThreadNamePrefix("spring-ts-");
    ts.setRemoveOnCancelPolicy(true);
    ts.setErrorHandler(t -> System.err.println("task error: " + t));
    ts.initialize();
    return ts;
}

关键要点

线程名很重要：排查线程栈、日志定位、告警归因都靠它
ErrorHandler 更像"集中兜底记录"：你仍应在任务内部捕获异常并做业务级处理
显式配置是必须的：不要依赖默认值，因为它可能不是你想要的

Spring 的 fixedRate/fixedDelay 与 JUC 的对应关系

Spring 注解	JUC 方法	语义	时间计算基准
`@Scheduled(fixedRate=1000)`	`scheduleAtFixedRate`	固定频率（理论上每1s执行）	上次开始时间 + period
`@Scheduled(fixedDelay=1000)`	`scheduleWithFixedDelay`	固定延迟（完成后延迟1s再执行）	上次完成时间 + delay
`@Scheduled(cron=...)`	无直接对应	Cron 语义（墙上时钟）	绝对时间点

关键差异：

fixedRate: 努力维持固定频率，但如果任务执行时间超过period，会等待任务完成后立即执行下一次
fixedDelay: 严格保证任务间隔，每次都在完成后等待delay时间
cron: 按照cron表达式的绝对时间执行，与任务执行时间无关

注意：@Scheduled(cron=...) 是 cron 语义（墙上时钟），通常更像 Quartz 的使用体验；但底层执行仍依赖 scheduler/线程池，仍会受线程池大小影响。

避免"任务重入"的手段

在 Spring 集群中，@Scheduled 默认每个实例都会跑一遍。常见做法：

用 DB/Redis 分布式锁（ShedLock 是常用库）保证同一时刻只有一个实例执行
或用 leader election（K8s lease / ZK / etcd）

此外即便单机，也可能因为任务慢造成"下一次触发时上一次还没结束"的重入风险（cron 语义更常见）。处理方式：

private final ReentrantLock lock = new ReentrantLock();

@Scheduled(cron = "0 */1 * * * *")
public void job() {
    if (!lock.tryLock()) {
        // 记录跳过执行，便于排查问题
        logger.warn("Previous job is still running, skipping this execution");
        return;
    }
    try { 
        doJob(); 
    } catch (Throwable t) {
        // 捕获所有异常，防止任务静默停止
        logger.error("Job execution failed", t);
    } finally { 
        lock.unlock(); 
    }
}

生产环境最佳实践

参数调优指南

@Component
public class ProductionThreadPoolConfig {
    
    // IO密集型任务配置
    @Bean("ioTaskExecutor")
    public TaskExecutor ioTaskExecutor() {
        ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();
        
        // IO密集型：线程数 = CPU核心数 × (1 + IO等待时间/CPU计算时间)
        int processors = Runtime.getRuntime().availableProcessors();
        executor.setCorePoolSize(processors * 8);    // 假设IO/CPU = 7:1
        executor.setMaxPoolSize(processors * 16);
        executor.setQueueCapacity(1000);
        
        executor.setThreadNamePrefix("io-worker-");
        executor.setRejectedExecutionHandler(new ThreadPoolExecutor.AbortPolicy());
        return executor;
    }
    
    // CPU密集型任务配置
    @Bean("cpuTaskExecutor")
    public TaskExecutor cpuTaskExecutor() {
        ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();
        
        // CPU密集型：线程数 ≈ CPU核心数
        int processors = Runtime.getRuntime().availableProcessors();
        executor.setCorePoolSize(processors);
        executor.setMaxPoolSize(processors);
        executor.setQueueCapacity(50);
        
        executor.setThreadNamePrefix("cpu-worker-");
        executor.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy());
        return executor;
    }
}

与其他框架组件的集成

与@Async注解集成

@Service
public class AsyncBusinessService {
    
    @Async("ioTaskExecutor")
    public CompletableFuture<String> processIoTask(String taskId) {
        // @Async已经将方法异步化到ioTaskExecutor，直接执行业务逻辑
        // 不要再使用CompletableFuture.supplyAsync()，避免双重异步化
        try {
            // 模拟IO操作
            Thread.sleep(1000);
            return CompletableFuture.completedFuture("Processed: " + taskId);
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
            // Java 9+ 可用 CompletableFuture.failedFuture(e)
            CompletableFuture<String> failedFuture = new CompletableFuture<>();
            failedFuture.completeExceptionally(e);
            return failedFuture;
        }
    }
    
    @Async("cpuTaskExecutor")
    public CompletableFuture<Integer> processCpuTask(List<Integer> numbers) {
        // CPU密集型并行计算
        int result = numbers.parallelStream()
                           .mapToInt(Integer::intValue)
                           .sum();
        return CompletableFuture.completedFuture(result);
    }
}

虚拟线程：Java 并发模型的未来

虚拟线程（Virtual Threads）是 JDK 21 正式引入的重要特性（JEP 444），代表了 Java 并发模型的未来方向。理解虚拟线程与传统线程池的差异，对架构决策至关重要。

为什么需要虚拟线程？

传统线程模型的困境

graph TD
    subgraph "传统平台线程模型"
        A[Java Thread] -->|1:1 映射| B[OS Thread]
        B --> C[内核调度]
        C --> D[上下文切换开销大]
        D --> E[线程数受限于内存]
        E --> F[线程池成为必需品]
    end
    
    subgraph "问题"
        F --> G[线程池大小难以调优]
        F --> H[阻塞操作浪费线程]
        F --> I[高并发场景受限]
    end

传统 Java 线程（平台线程）的问题：

问题	描述	影响
内存开销大	每个线程默认栈大小 1MB	10000 线程 ≈ 10GB 内存
创建成本高	需要 OS 内核参与	创建/销毁耗时约 1ms
上下文切换昂贵	内核态切换	约 1-10μs 每次切换
数量受限	受 OS 和内存限制	通常数千到数万

虚拟线程的解决方案

graph TD
    subgraph "虚拟线程模型"
        A1[Virtual Thread 1] --> B1[Carrier Thread 1]
        A2[Virtual Thread 2] --> B1
        A3[Virtual Thread 3] --> B1
        A4[Virtual Thread 4] --> B2[Carrier Thread 2]
        A5[Virtual Thread ...] --> B2
        A6[Virtual Thread N] --> B2
        
        B1 --> C1[OS Thread 1]
        B2 --> C2[OS Thread 2]
    end
    
    subgraph "优势"
        D[M:N 调度模型]
        E[JVM 管理调度]
        F[阻塞时自动让出]
        G[百万级并发]
    end

虚拟线程 vs 平台线程

核心差异对比

特性	平台线程 (Platform Thread)	虚拟线程 (Virtual Thread)
映射关系	1:1 映射到 OS 线程	M:N 映射（多对少）
调度者	OS 内核	JVM（用户态调度）
栈大小	固定（默认 1MB）	动态增长（初始 KB 级）
创建成本	高（~1ms）	极低（~1μs）
数量上限	数千到数万	数百万
阻塞行为	阻塞 OS 线程	自动挂起，让出载体线程
适用场景	CPU 密集型	IO 密集型

代码对比

// ========== 传统平台线程池方式 ==========
ExecutorService platformPool = Executors.newFixedThreadPool(200);

// 问题：200个线程处理10000个请求，大量时间浪费在等待IO
List<Future<String>> futures = new ArrayList<>();
for (int i = 0; i < 10000; i++) {
    final int id = i;
    futures.add(platformPool.submit(() -> {
        // 模拟IO操作（数据库查询、HTTP调用等）
        Thread.sleep(100); // 线程被阻塞，无法处理其他请求
        return "Result-" + id;
    }));
}

// ========== 虚拟线程方式 (JDK 21+) ==========
try (ExecutorService virtualPool = Executors.newVirtualThreadPerTaskExecutor()) {
    // 优势：可以创建10000个虚拟线程，每个请求一个线程
    List<Future<String>> futures = new ArrayList<>();
    for (int i = 0; i < 10000; i++) {
        final int id = i;
        futures.add(virtualPool.submit(() -> {
            // 虚拟线程阻塞时自动让出载体线程
            Thread.sleep(100); // 不会阻塞载体线程！
            return "Result-" + id;
        }));
    }
    
    // 收集结果
    for (Future<String> future : futures) {
        System.out.println(future.get());
    }
} // try-with-resources 自动关闭

虚拟线程的工作原理

挂载与卸载机制

sequenceDiagram
    participant VT as Virtual Thread
    participant CT as Carrier Thread
    participant OS as OS Thread
    participant IO as IO Operation

    Note over VT,OS: 虚拟线程执行流程
    
    VT->>CT: 挂载 (mount)
    CT->>OS: 执行用户代码
    
    VT->>IO: 发起阻塞IO
    Note over VT: 检测到阻塞操作
    VT->>CT: 卸载 (unmount)
    Note over CT: 载体线程空闲，可执行其他虚拟线程
    
    IO-->>VT: IO完成
    VT->>CT: 重新挂载 (remount)
    CT->>OS: 继续执行

虚拟线程调度模型：与 Go GPM 的对比

理解虚拟线程的调度机制，需要与 Go 语言的 GPM 模型进行对比。两者都实现了 M:N 调度，但设计哲学有所不同。

Go 的 GPM 模型

graph TB
    subgraph "Go Runtime"
        G1[Goroutine 1]
        G2[Goroutine 2]
        G3[Goroutine 3]
        G4[Goroutine 4]
        
        P1[P: Processor 1<br/>本地队列]
        P2[P: Processor 2<br/>本地队列]
        
        M1[M: OS Thread 1]
        M2[M: OS Thread 2]
        
        GQ[Global Queue<br/>全局队列]
        
        G1 --> P1
        G2 --> P1
        G3 --> P2
        G4 --> GQ
        
        P1 --> M1
        P2 --> M2
        
        M1 --> OS1[OS Scheduler]
        M2 --> OS1
    end
    
    style P1 fill:#90EE90
    style P2 fill:#90EE90

Java 虚拟线程模型

graph TB
    subgraph "JVM"
        VT1[Virtual Thread 1]
        VT2[Virtual Thread 2]
        VT3[Virtual Thread 3]
        VT4[Virtual Thread 4]
        
        WQ1[WorkQueue 1]
        WQ2[WorkQueue 2]
        
        CT1[Carrier Thread 1<br/>ForkJoinWorkerThread]
        CT2[Carrier Thread 2<br/>ForkJoinWorkerThread]
        
        VT1 -.unmounted.-> WQ1
        VT2 --> CT1
        VT3 --> CT2
        VT4 -.unmounted.-> WQ2
        
        CT1 --> OS1[OS Thread 1]
        CT2 --> OS2[OS Thread 2]
        
        OS1 --> OSS[OS Scheduler]
        OS2 --> OSS
    end
    
    style CT1 fill:#87CEEB
    style CT2 fill:#87CEEB

核心差异对比

维度	Go GPM	Java Virtual Thread
G (Goroutine)	用户态协程	虚拟线程 (Virtual Thread)
P (Processor)	逻辑处理器，持有 G 的本地队列	无显式 P 概念，使用 ForkJoinPool 的 WorkQueue
M (Machine)	OS 线程	Carrier Thread (载体线程)
调度器	Go Runtime Scheduler	ForkJoinPool (work-stealing)
队列模型	本地队列 + 全局队列	每个 Carrier Thread 的 WorkQueue
Work Stealing	P 之间窃取 G	Carrier Thread 之间窃取任务
阻塞处理	M 阻塞时创建新 M	正常情况：Carrier Thread 不阻塞，虚拟线程 unmount；Pinning 场景（synchronized/JNI）：Carrier Thread 被阻塞

关键设计差异

Go 的 P (Processor)：
- Go 显式引入了 P 的概念，作为 G 和 M 之间的中介
- P 的数量通常等于 CPU 核心数（GOMAXPROCS）
- P 持有本地队列，减少全局队列的竞争
Java 的简化模型：
- Java 没有显式的 P 概念
- 直接使用 ForkJoinPool 的 work-stealing 机制
- Carrier Thread 数量默认等于 CPU 核心数
- 每个 Carrier Thread 有自己的 WorkQueue

为什么 Java 不需要 P？

Go 的 P 设计是为了解决以下问题：

减少全局队列的锁竞争
支持 work-stealing
管理 G 的本地缓存

Java 虚拟线程通过 ForkJoinPool 已经实现了这些功能：

ForkJoinPool 本身就是为 work-stealing 设计的
每个 ForkJoinWorkerThread 有自己的双端队列
无需额外的 P 抽象层

虚拟线程的 Continuation 机制：unmount/mount 的本质

虚拟线程的核心是 Continuation（延续）机制。这是理解 unmount/mount 行为的关键。

什么是 Continuation？

Continuation 是一种可以暂停和恢复执行的程序抽象。在 Java 中，它是 jdk.internal.vm.Continuation 类的实例。

// 简化的 Continuation 概念示例（实际是 JVM 内部实现）
class Continuation {
    private Object[] stack;  // 保存的栈帧
    private int pc;          // 程序计数器
    
    void run() {
        // 执行到 yield 点
    }
    
    void yield() {
        // 保存当前栈帧和 PC
        // 返回到调用者
    }
    
    void resume() {
        // 恢复栈帧和 PC
        // 继续执行
    }
}

虚拟线程的 unmount/mount 流程

stateDiagram-v2
    [*] --> Unmounted: 创建虚拟线程
    
    Unmounted --> Mounted: mount()<br/>分配 Carrier Thread
    
    Mounted --> Running: 开始执行
    
    Running --> Unmounted: unmount()<br/>遇到阻塞操作
    
    Running --> Pinned: 遇到 synchronized<br/>或 native 方法
    
    Pinned --> Running: 阻塞操作完成<br/>(Carrier Thread 被阻塞)
    
    Unmounted --> Mounted: IO 完成<br/>重新调度
    
    Running --> [*]: 任务完成
    
    note right of Unmounted
        虚拟线程状态保存在堆中
        Continuation 保存栈帧
        不占用 Carrier Thread
    end note
    
    note right of Mounted
        虚拟线程在 Carrier Thread 上执行
        栈帧在 Carrier Thread 的栈上
    end note
    
    note right of Pinned
        无法 unmount
        Carrier Thread 被阻塞
        降级为平台线程行为
    end note

自动 unmount 的场景

根据 JEP 444 和 JDK 源码，虚拟线程在以下场景会自动 unmount：

阻塞操作	是否 unmount	说明
`Thread.sleep()`	是	JDK 内部实现为 `Continuation.yield()`
`Object.wait()`	是	不在 synchronized 块内时
`LockSupport.park()`	是	虚拟线程的标准阻塞原语
`BlockingQueue.take()`	是	内部使用 `LockSupport.park()`
`Semaphore.acquire()`	是	内部使用 `LockSupport.park()`
`ReentrantLock.lock()`	是	阻塞时使用 `LockSupport.park()`
Socket I/O	是	JDK 改造为非阻塞实现
File I/O	是	JDK 改造为非阻塞实现
`synchronized` 块	否	Pinning 问题
JNI 调用	否	Pinning 问题
CPU 密集计算	否	无阻塞点，无法 unmount

unmount 的实现原理

// 虚拟线程阻塞时的简化流程
public class VirtualThreadBlocking {
    
    // 当虚拟线程调用 Thread.sleep() 时
    public static void sleep(long millis) {
        // 1. 检查当前线程是否是虚拟线程
        if (Thread.currentThread().isVirtual()) {
            // 2. 调用 Continuation.yield()
            //    - 保存当前栈帧到堆中
            //    - 释放 Carrier Thread
            //    - 注册唤醒回调（定时器）
            Continuation.yield(SLEEP_SCOPE);
            
            // 3. 当定时器触发时
            //    - 虚拟线程被重新调度
            //    - 分配新的 Carrier Thread
            //    - 恢复栈帧，继续执行
        } else {
            // 平台线程：直接调用 OS sleep
            Thread0.sleep(millis);
        }
    }
}

与 C 协程的差异：隐式 vs 显式调度

这是一个关键的设计差异：

C 协程（如 libco）：

// C 协程支持显式 yield
void* coroutine_func(void* arg) {
    printf("Step 1\n");
    co_yield();  // 显式让出 CPU
    printf("Step 2\n");
    co_yield();  // 再次显式让出
    printf("Step 3\n");
}

Java 虚拟线程：

// Java 虚拟线程是隐式调度
Thread.ofVirtual().start(() -> {
    System.out.println("Step 1");
    // 无法显式 yield！
    // 只能通过阻塞操作触发 unmount
    Thread.sleep(0);  // 隐式 yield
    System.out.println("Step 2");
});

为什么 Java 选择隐式调度？

向后兼容：现有的阻塞 API 无需修改即可工作
简化编程：开发者无需关心调度细节
安全性：避免程序员错误使用 yield 导致的问题
性能：JVM 可以优化 unmount 时机

unmount 的性能开销

// unmount 的成本分析
public class UnmountCost {
    
    // 1. 保存栈帧到堆（几百纳秒）
    //    - 拷贝栈帧数据
    //    - 保存程序计数器
    
    // 2. 释放 Carrier Thread（几十纳秒）
    //    - 从 Carrier Thread 解绑
    
    // 3. 重新调度（微秒级）
    //    - 等待 IO 完成
    //    - 分配新的 Carrier Thread
    //    - 恢复栈帧
    
    // 总开销：约 1-10 微秒
    // 对比：平台线程上下文切换约 1-10 微秒
    // 但虚拟线程的优势在于不阻塞 Carrier Thread
}

要点

Java 虚拟线程不是"完全"的协程：
- 无法在任意点 yield
- 只能在特定的阻塞点 unmount
- 这是设计选择，不是技术限制
unmount 是自动的，不是手动的：
- JVM 检测到阻塞操作时自动触发
- 开发者无需（也无法）显式控制
Pinning 是虚拟线程的限制：
- synchronized 和 JNI 调用无法 unmount
- 这是当前实现的限制，未来可能改进
虚拟线程的价值不在于"任意点切换"：
- 而在于"阻塞时不浪费 Carrier Thread"
- 这对 IO 密集型应用已经足够

关键概念

/**
 * 虚拟线程核心概念示例
 */
public class VirtualThreadConcepts {

    public static void main(String[] args) throws Exception {
        // 1. 创建虚拟线程的三种方式
        
        // 方式一：Thread.ofVirtual()
        Thread vt1 = Thread.ofVirtual()
            .name("virtual-thread-1")
            .start(() -> {
                System.out.println("Running on: " + Thread.currentThread());
                System.out.println("Is virtual: " + Thread.currentThread().isVirtual());
            });
        
        // 方式二：Thread.startVirtualThread()
        Thread vt2 = Thread.startVirtualThread(() -> {
            System.out.println("Quick virtual thread");
        });
        
        // 方式三：Executors.newVirtualThreadPerTaskExecutor()
        try (var executor = Executors.newVirtualThreadPerTaskExecutor()) {
            executor.submit(() -> {
                System.out.println("Virtual thread from executor");
            });
        }
        
        vt1.join();
        vt2.join();
        
        // 2. 虚拟线程的特性
        Thread.ofVirtual().start(() -> {
            // 获取载体线程（仅用于调试）
            // 注意：生产代码不应依赖载体线程
            System.out.println("Virtual thread running");
            
            try {
                // 阻塞操作会触发卸载
                Thread.sleep(100);
                // sleep 期间，载体线程可以执行其他虚拟线程
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
            }
        }).join();
    }
}

虚拟线程的使用原则

原则一：不要池化虚拟线程

// [错误] 不要池化虚拟线程！
ExecutorService wrongPool = Executors.newFixedThreadPool(100, 
    Thread.ofVirtual().factory()); // 错误：限制了虚拟线程数量

// [正确] 每个任务一个虚拟线程
ExecutorService correctPool = Executors.newVirtualThreadPerTaskExecutor();
// 虚拟线程非常轻量，无需池化

为什么虚拟线程无需池化？

传统线程池的设计目的是复用昂贵的操作系统线程资源。理解这一点是理解虚拟线程设计哲学的关键。

平台线程的成本结构：

成本项	平台线程	虚拟线程
创建成本	~1ms（需要 OS 内核参与）	~1μs（纯 JVM 对象创建）
内存占用	固定 1MB 栈空间	初始几 KB，按需增长
调度开销	内核态切换（~1-10μs）	用户态切换（纳秒级）
数量上限	数千到数万（受内存限制）	数百万（受堆内存限制）

虚拟线程的"用完即弃"设计：

根据 JEP 444，虚拟线程被设计为 use-and-throw-away（用完即弃）资源：

// 虚拟线程的创建成本接近普通对象
Thread vt = Thread.ofVirtual().start(() -> {
    // 执行任务
});
// 任务完成后，虚拟线程被 GC 回收，无需复用

池化虚拟线程的问题：

违背设计初衷：虚拟线程本身就是为了避免池化的复杂性
限制并发能力：池化会人为限制虚拟线程数量，失去其核心优势
增加复杂性：需要管理池的生命周期、任务队列等
状态清理开销：复用线程需要清理 ThreadLocal 等状态，反而增加开销

对比示例：

// 平台线程：必须池化
ExecutorService platformPool = Executors.newFixedThreadPool(200);
// 原因：创建 10000 个平台线程会耗尽内存（10GB+）

// 虚拟线程：无需池化
try (var virtualPool = Executors.newVirtualThreadPerTaskExecutor()) {
    // 可以轻松创建 10000 个虚拟线程（仅需 ~20MB）
    for (int i = 0; i < 10000; i++) {
        virtualPool.submit(() -> doWork());
    }
}

要点：虚拟线程将"线程"从"昂贵的需要复用的资源"变成了"廉价的可随意创建的对象"。这是并发编程范式的重大转变。

原则二：避免在虚拟线程中执行 CPU 密集型任务

// [错误] CPU密集型任务不适合虚拟线程
try (var executor = Executors.newVirtualThreadPerTaskExecutor()) {
    executor.submit(() -> {
        // CPU密集型计算
        long result = 0;
        for (long i = 0; i < 10_000_000_000L; i++) {
            result += i;
        }
        return result;
    });
}

// [正确] CPU密集型任务使用平台线程池
ExecutorService cpuPool = Executors.newFixedThreadPool(
    Runtime.getRuntime().availableProcessors()
);
cpuPool.submit(() -> {
    // CPU密集型计算
    return heavyComputation();
});

原因：虚拟线程的优势在于 IO 等待期间让出载体线程。CPU 密集型任务没有等待，无法发挥虚拟线程优势。

原则三：注意 synchronized 和 native 方法的 Pinning 问题

// [问题] synchronized 会导致虚拟线程 "pinning"（钉住载体线程）
public class PinningExample {
    private final Object lock = new Object();
    
    // [错误] synchronized 块内的阻塞操作会钉住载体线程
    public void badMethod() {
        synchronized (lock) {
            try {
                Thread.sleep(1000); // 载体线程被钉住！
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
            }
        }
    }
    
    // [正确] 使用 ReentrantLock 替代 synchronized
    private final ReentrantLock reentrantLock = new ReentrantLock();
    
    public void goodMethod() {
        reentrantLock.lock();
        try {
            Thread.sleep(1000); // 虚拟线程可以正常卸载
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        } finally {
            reentrantLock.unlock();
        }
    }
}

Pinning（钉住）：当虚拟线程执行 synchronized 块或 native 方法时，无法从载体线程卸载，导致载体线程被阻塞。

原则四：正确使用 ThreadLocal

// [注意] 虚拟线程与 ThreadLocal 的交互
public class ThreadLocalWithVirtualThreads {
    
    // 传统 ThreadLocal 在虚拟线程中仍然有效
    // 但要注意：百万虚拟线程 × ThreadLocal 数据 = 巨大内存开销
    private static final ThreadLocal<ExpensiveObject> threadLocal = 
        ThreadLocal.withInitial(ExpensiveObject::new);
    
    // [推荐] 对于虚拟线程，考虑使用 ScopedValue (JDK 21 Preview)
    // ScopedValue 是不可变的，更适合虚拟线程场景
    // private static final ScopedValue<String> SCOPED_VALUE = ScopedValue.newInstance();
    
    public void process() {
        // 使用 ThreadLocal
        ExpensiveObject obj = threadLocal.get();
        // ... 使用 obj
        
        // [重要] 虚拟线程结束后，ThreadLocal 会被清理
        // 但如果虚拟线程数量巨大，仍需注意内存
    }
}

ThreadLocal 在虚拟线程中为何仍然有效？

这是一个重要的设计决策，需要从JVM实现层面理解：

graph LR
    A[虚拟线程创建] --> B[继承载体线程ThreadLocal]
    B --> C[创建独立ThreadLocal映射]
    C --> D[执行期间访问本地数据]
    D --> E[虚拟线程结束]
    E --> F[自动清理ThreadLocal]
    
    subgraph "载体线程"
        G[ThreadLocal Map]
    end
    
    subgraph "虚拟线程"
        H[独立ThreadLocal Map]
        I[执行任务]
    end
    
    G -.-> B
    B --> H
    H --> D
    H --> F

Technical Details：

继承机制：虚拟线程创建时会继承载体线程的ThreadLocal值副本
独立存储：每个虚拟线程维护自己的ThreadLocal映射表，与载体线程隔离
生命周期管理：虚拟线程结束时，JVM会自动清理其ThreadLocal变量，防止内存泄漏

JDK实现改进：

增加了针对大量虚拟线程的内存优化策略
改进了ThreadLocal清理机制的性能
添加了虚拟线程专用的ThreadLocal访问路径

ScopedValue 为什么优于 ThreadLocal？

对于虚拟线程场景，ScopedValue是更好的选择：

graph TD
    A[并发数据传递需求] --> B{选择哪种机制?}
    B -->|传统场景| C[ThreadLocal]
    B -->|虚拟线程场景| D[ScopedValue]
    
    C --> E[可变状态]
    C --> F[潜在内存泄漏]
    C --> G[性能开销]
    
    D --> H[不可变数据]
    D --> I[明确作用域]
    D --> J[零内存泄漏风险]
    D --> K[更高性能]

ScopedValue的核心优势：

不可变性保证：一旦设置就无法修改，避免并发修改问题
作用域明确：具有清晰的生命周期边界，不会跨作用域泄漏
M:N调度友好：不依赖具体线程身份，在虚拟线程的载体线程切换中表现更好
性能优势：避免了ThreadLocal的哈希表查找和冲突处理开销

Specification依据：根据JEP 429和JEP 446规范，ScopedValue专为结构化并发和虚拟线程场景设计，解决了ThreadLocal在大规模并发下的根本性问题。

虚拟线程与传统线程池的选择

决策流程图

flowchart TD
    A[新任务] --> B{任务类型?}
    
    B -->|IO密集型| C{JDK版本?}
    C -->|JDK 21+| D[使用虚拟线程]
    C -->|JDK 21以下| E[使用传统IO线程池]
    
    B -->|CPU密集型| F[使用平台线程池]
    F --> G[线程数 = CPU核心数]
    
    B -->|混合型| H{主要瓶颈?}
    H -->|IO等待| D
    H -->|CPU计算| F
    
    D --> I[newVirtualThreadPerTaskExecutor]
    E --> J[newCachedThreadPool 或 自定义线程池]
    
    style D fill:#90EE90
    style F fill:#87CEEB
    style E fill:#FFE4B5

场景对比

场景	推荐方案	原因
Web 服务器处理 HTTP 请求	虚拟线程	大量 IO 等待（数据库、外部 API）
批量数据处理/ETL	虚拟线程	文件 IO、网络传输
图像/视频处理	平台线程池	CPU 密集型计算
科学计算/机器学习	平台线程池 + ForkJoinPool	CPU 密集型，需要并行计算
实时交易系统	平台线程池	低延迟要求，避免 JVM 调度开销
微服务间调用	虚拟线程	大量网络 IO 等待

迁移示例

/**
 * 从传统线程池迁移到虚拟线程
 */
public class MigrationExample {

    // ========== 迁移前：传统线程池 ==========
    private final ExecutorService legacyPool = new ThreadPoolExecutor(
        10, 100, 60L, TimeUnit.SECONDS,
        new LinkedBlockingQueue<>(1000),
        new ThreadPoolExecutor.CallerRunsPolicy()
    );
    
    public CompletableFuture<String> fetchDataLegacy(String url) {
        return CompletableFuture.supplyAsync(() -> {
            // 模拟 HTTP 调用
            return httpClient.get(url);
        }, legacyPool);
    }
    
    // ========== 迁移后：虚拟线程 ==========
    private final ExecutorService virtualPool = 
        Executors.newVirtualThreadPerTaskExecutor();
    
    public CompletableFuture<String> fetchDataVirtual(String url) {
        return CompletableFuture.supplyAsync(() -> {
            // 相同的业务逻辑，无需修改
            return httpClient.get(url);
        }, virtualPool);
    }
    
    // ========== 混合模式：IO 用虚拟线程，CPU 用平台线程 ==========
    private final ExecutorService ioPool = 
        Executors.newVirtualThreadPerTaskExecutor();
    private final ExecutorService cpuPool = 
        Executors.newFixedThreadPool(Runtime.getRuntime().availableProcessors());
    
    public CompletableFuture<ProcessedData> fetchAndProcess(String url) {
        return CompletableFuture
            .supplyAsync(() -> httpClient.get(url), ioPool)      // IO：虚拟线程
            .thenApplyAsync(data -> heavyProcess(data), cpuPool); // CPU：平台线程
    }
}

虚拟线程的性能特征

吞吐量对比

/**
 * 虚拟线程 vs 平台线程性能对比示例
 */
public class PerformanceComparison {

    private static final int TASK_COUNT = 100_000;
    private static final int IO_DELAY_MS = 50;

    public static void main(String[] args) throws Exception {
        // 平台线程池（200线程）
        long platformTime = benchmarkPlatformThreads();
        System.out.println("Platform threads: " + platformTime + " ms");
        
        // 虚拟线程
        long virtualTime = benchmarkVirtualThreads();
        System.out.println("Virtual threads: " + virtualTime + " ms");
    }
    
    static long benchmarkPlatformThreads() throws Exception {
        ExecutorService pool = Executors.newFixedThreadPool(200);
        long start = System.currentTimeMillis();
        
        List<Future<?>> futures = new ArrayList<>();
        for (int i = 0; i < TASK_COUNT; i++) {
            futures.add(pool.submit(() -> {
                Thread.sleep(IO_DELAY_MS);
                return null;
            }));
        }
        
        for (Future<?> f : futures) f.get();
        pool.shutdown();
        
        return System.currentTimeMillis() - start;
    }
    
    static long benchmarkVirtualThreads() throws Exception {
        long start = System.currentTimeMillis();
        
        try (var pool = Executors.newVirtualThreadPerTaskExecutor()) {
            List<Future<?>> futures = new ArrayList<>();
            for (int i = 0; i < TASK_COUNT; i++) {
                futures.add(pool.submit(() -> {
                    Thread.sleep(IO_DELAY_MS);
                    return null;
                }));
            }
            
            for (Future<?> f : futures) f.get();
        }
        
        return System.currentTimeMillis() - start;
    }
}

// 典型结果（100,000 任务，50ms IO 延迟）：
// Platform threads (200): ~25,000 ms
// Virtual threads: ~100 ms
// 
// 虚拟线程快 250 倍！
// 原因：平台线程受限于 200 个线程，需要排队
//       虚拟线程可以同时处理所有任务

内存占用对比

线程类型	10,000 线程内存	100,000 线程内存	1,000,000 线程内存
平台线程	~10 GB	~100 GB（不可行）	不可能
虚拟线程	~20 MB	~200 MB	~2 GB

响应式编程：RxJava 与 Reactor

RxJava

%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#E1D5E7', 'edgeLabelBackground':'#FFF', 'fontFamily': 'monospace'}}}%%
sequenceDiagram
    participant Client as Client
    participant Observable as Observable
    participant Operator1 as map
    participant Operator2 as filter
    participant Subscriber as Subscriber

    Note over Client,Subscriber: RxJava (响应式流)
    Client->>Observable: create(emitter)
    Observable-->>Operator1: 注册操作符
    Operator1->>Observable: map(transform)
    Observable-->>Operator2: 注册操作符
    Operator2->>Observable: filter(predicate)
    Observable-->>Subscriber: subscribe(Subscriber)
    Note right of Client: 非阻塞订阅

    par 数据流处理
        Observable->>Operator1: onNext(item)
        Operator1->>Operator2: onNext(mapped)
        Operator2->>Subscriber: onNext(filtered)
    end

    Observable->>Subscriber: onComplete()
    Note over Client: 响应式: map/filter/subscribe

// 核心特点：数据流处理，背压支持
Observable<String> observable1 = Observable.fromCallable(() -> {
    Thread.sleep(1000);
    return "Hello";
}).subscribeOn(Schedulers.io());

Observable<String> observable2 = Observable.fromCallable(() -> {
    Thread.sleep(500);
    return "RxJava";
}).subscribeOn(Schedulers.io());

// [正确] 非阻塞：流式处理
Observable.zip(observable1, observable2, (s1, s2) -> s1 + " " + s2)
    .map(String::toUpperCase)
    .timeout(2, TimeUnit.SECONDS)
    .onErrorReturn(ex -> "FALLBACK: " + ex.getMessage())
    .subscribe(
        result -> System.out.println("结果: " + result),
        error -> System.err.println("错误: " + error.getMessage())
    );

// [注意] RxJava通常不需要手动关闭调度器

Reactor

%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#9DC3E6', 'edgeLabelBackground':'#FFF', 'fontFamily': 'monospace'}}}%%
sequenceDiagram
    participant Client as Client
    participant Flux as Flux
    participant Operator1 as map
    participant Operator2 as flatMap
    participant Subscriber as Subscriber

    Note over Client,Subscriber: Reactor (响应式流)
    Client->>Flux: create(sink)
    Flux-->>Operator1: 注册操作符
    Operator1->>Flux: map(transform)
    Flux-->>Operator2: 注册操作符
    Operator2->>Flux: flatMap(asyncOp)
    Flux-->>Subscriber: subscribe(Subscriber)
    Note right of Client: 非阻塞订阅

    par 数据流处理
        Flux->>Operator1: onNext(item)
        Operator1->>Operator2: onNext(mapped)
        Operator2->>Subscriber: onNext(result)
    end

    Flux->>Subscriber: onComplete()
    Note over Client: 响应式: map/flatMap/subscribe

// 核心特点：响应式流，背压内建，Spring集成
Flux<String> flux1 = Flux.fromCallable(() -> {
    Thread.sleep(1000);
    return "Hello";
}).subscribeOn(Schedulers.boundedElastic());

Flux<String> flux2 = Flux.fromCallable(() -> {
    Thread.sleep(500);
    return "Reactor";
}).subscribeOn(Schedulers.boundedElastic());

// [正确] 非阻塞：声明式流处理
Flux.zip(flux1, flux2, (s1, s2) -> s1 + " " + s2)
    .map(String::toUpperCase)
    .timeout(Duration.ofSeconds(2))
    .onErrorResume(ex -> Mono.just("FALLBACK: " + ex.getMessage()))
    .subscribe(
        result -> System.out.println("结果: " + result),
        error -> System.err.println("错误: " + error.getMessage()),
        () -> System.out.println("完成")
    );

// [注意] Reactor通常由Spring管理生命周期

总结：线程池技术的演进

timeline
    title Java 并发模型演进
    
    section JDK 1.0-1.4
        1996 : Thread 类
             : 手动管理线程
    
    section JDK 5
        2004 : ExecutorService
             : ThreadPoolExecutor
             : 线程池标准化
    
    section JDK 7
        2011 : ForkJoinPool
             : 工作窃取算法
             : 分治并行
    
    section JDK 8
        2014 : CompletableFuture
             : 异步编程
             : 链式组合
    
    section JDK 21
        2023 : Virtual Threads
             : 百万级并发
             : 简化异步编程

技术选型总结

技术	适用场景	核心优势	注意事项
ThreadPoolExecutor	通用任务执行	成熟稳定，参数可控	需要调优线程池参数
ForkJoinPool	分治/递归任务	工作窃取，高效并行	任务需可分解
CompletableFuture	异步编排	链式组合，声明式	注意线程池选择
Virtual Threads	IO 密集型高并发	轻量级，简化编程	JDK 21+，避免 Pinning

要点：虚拟线程不是要取代线程池，而是为 IO 密集型场景提供更简单、更高效的解决方案。在 CPU 密集型场景，传统线程池仍然是最佳选择。理解每种技术的适用场景，才能做出正确的架构决策。

模式速查表

模式	核心要点	适用场景
线程池选型三板斧	CPU 密集型：核心数+1；IO 密集型：核心数×2 或核心数/(1-阻塞系数)；混合型：拆分为独立池	所有需要线程池的场景
有界队列+明确拒绝策略	永远不用无界队列（`Executors.newFixedThreadPool` 的 `LinkedBlockingQueue` 是无界的），必须设置队列容量和拒绝策略	生产环境线程池配置
周期任务防御性编程	周期任务必须 `try-catch(Throwable)` 包裹全部逻辑，否则首次异常后静默终止	`scheduleAtFixedRate` / `scheduleWithFixedDelay`
cancel 后清理队列	高频 cancel 场景必须 `setRemoveOnCancelPolicy(true)`，否则已取消任务堆积导致内存泄漏	超时控制、请求级定时任务
shutdown 优雅关闭	`shutdown()` → `awaitTermination()` → `shutdownNow()` 三步走，给足等待时间	应用关闭、线程池生命周期管理
FutureTask 状态机	7 种状态单向流转（NEW→COMPLETING→NORMAL/EXCEPTIONAL/CANCELLED/INTERRUPTING/INTERRUPTED），CAS 保证线程安全	理解 Future 取消/异常行为
execute vs submit	`execute` 异常由 `UncaughtExceptionHandler` 处理；`submit` 异常被 Future 吞掉，需 `get()` 才能感知	选择任务提交方式
Rate vs Delay	`scheduleAtFixedRate`：基于理论时间轴，有追赶机制；`scheduleWithFixedDelay`：基于实际结束时间，无追赶	选择周期调度策略
ThreadFactory 命名	自定义 `ThreadFactory` 设置有意义的线程名前缀 + `UncaughtExceptionHandler`	所有自建线程池
CompletableFuture 异步编排	优先用 `thenCompose` 替代 `thenApply` + `join` 嵌套；注意默认使用 `ForkJoinPool.commonPool()` 的风险	异步任务编排
池隔离原则	不同类型任务（CPU/IO/定时）使用独立线程池，避免相互影响	多类型任务并存的系统
CAS + 锁分层	高频操作（线程计数）用 CAS 无锁化，低频操作（workers 集合修改）用 mainLock 互斥	高并发状态管理（ThreadPoolExecutor 的 ctl 设计）
Worker 不可重入锁	Worker 继承 AQS 实现不可重入锁，`tryLock()` 失败说明线程正在执行任务，`shutdown()` 不应中断	区分空闲线程与工作线程
CompletableFuture 完成保证	每个 CompletableFuture 必须最终被完成（normal/exceptional/cancel），否则下游永久阻塞	异步编排中的资源泄漏防护
虚拟线程使用原则	不池化（每次创建新实例）、避免 CPU 密集型任务、注意 `synchronized` 导致的 Pinning	JDK 21+ IO 密集型高并发场景
Spring @Scheduled 单线程陷阱	Spring `@Scheduled` 默认使用单线程调度器，一个任务阻塞会影响所有定时任务，必须显式配置线程池	Spring 定时任务配置

关于 JVM 内存模型（JMM）、volatile 语义、happens-before 规则等内容，请参阅《JVM 的内存模型与线程》。

Author: magicliang

Link: https://magicliang.github.io/2026/01/24/Java-%E7%BA%BF%E7%A8%8B%E6%B1%A0%E7%AC%94%E8%AE%B0/

JVM Java 多线程线程池

2026-01-18

无锁队列

Java 一读一写（SPSC）：Memory Barrier + Volatile 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657/** * Single-Producer Single-Consumer (SPSC) 无锁环形队列。 * * <p>原理说明： * - 仅允许一个线程调用 {@code offer()}，一个线程调用 {@code poll()}。 * - 由于没有写竞争，无需 CAS；只需保证写操作对消费者可见。 * - 使用两个 volatile 索引（head/tail）建立 happens-before 关系： * 生产者写入元素 → volatile 写 tail → 消费者 volatile 读 tail → 读取元素。 * - 这本质上利用了 Java 内存模型中的“volatile 写-读”内存屏障（StoreLoad）， * ...

2026-01-12

Java 并发编程笔记

juc.xmind 写在前面的话并发编程最早的实践都在操作系统里。高层语言的并发模型都要基于底层系统对硬件抽象和并发的设计来设计和实现，不能超出操作系统允许的范围。所谓的高级抽象总体上是简化对 OS 底层机制的复杂调用。并发与异步本文聚焦并发（Concurrency），即多任务在同一时间段内的交替或并行执行，核心问题是资源共享、线程同步与协作。 **异步（Asynchronous）**是另一维度：调用方发起操作后不等结果返回即继续执行，通过回调、Future或事件机制获取结果。异步可通过单线程事件循环实现，也可依托多线程并发实现。二者关系：并发关注"多任务如何执行与协调"，异步关注"调用是否阻塞等待"。并发编程常涉及异步，但本文不展开异步编程模式（如响应式流、协程），相关内容请参阅《Java 线程池笔记》。管程理论和实践之间是有鸿沟的，要弥合这种鸿沟，通常需要我们去学习别人的实践。比如并发的标准设计思想来自于操作系统里的管程（monitor），我们应当学习管程，进而了解标准的并发模型-管理共享变量和线程（并发任务）间通信的基本...

2026-01-19

线程安全与锁优化

版本说明：本文主要基于 JDK 6 ~ JDK 14 的 HotSpot 虚拟机实现。需要注意的是，从 JDK 15 开始，偏向锁已被默认关闭并标记为废弃（JEP 374）。如果你使用的是 JDK 15+，文中关于偏向锁的内容仅作为历史参考。线程安全什么是线程安全 “当多个线程访问一个对象时，如果不用考虑这些线程在运行时环境下的调度和交替执行，也不需要进行额外的同步，或者在调用方法进行任何其他的协调操作，调用这个对象的行为都可以获得正确的结果，那么这个对象就是线程安全的。” 相对的线程安全，可以分成五个等级。但在深入讨论线程安全的分类之前，我们需要先理解 Java 内存模型——它是理解线程安全问题的理论基础。 Java 内存模型基础 Java 内存模型（Java Memory Model，JMM）是 Java 语言规范的一部分，定义了多线程程序中共享变量的访问规则。理解 JMM 是理解线程安全问题的基础。为什么需要内存模型？现代计算机系统中，CPU 与主内存之间存在巨大的速度差异。为了弥补这一差距，硬件层面引入了多级缓存（L1、L2、L3 Cache）。这带来了一个问...

2018-10-22

JDWP 与远程调试

JDWP（Java Debug Wire Protocol），它提供了调试器和目标 JVM （target vm）之间的调试协议。在 target vm 启动时，增加这个 JAVA_OPTS： 1JAVA_OPTS="-Xdebug -Xnoagent -Djava.compiler=NONE -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=26310" 在服务器端，增加 remote debuging 的时候使用如下配置： 12345678# Java 9 以上-agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=*:8000# Java 5-8-agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=8000# Java 1.4.x -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,addre...

2020-09-27

现代垃圾收集器

所有的垃圾收集器，都基于弱分代假设。实际的垃圾回收效率取决于堆内对象的分布状况。垃圾回收并不能解决内存泄漏或者应用程序逻辑的不良分配习惯问题，要处理 JVM 内存回收问题的根本方法是对程序进行调优。有几个常用原则：减少临时对象，尽量复用内存。使用对象池。主动提前释放对象。主动 gc。好的代码比 tuning 更重要。选 gc 算法比 tuning 参数重要，tuning 参数是最后一步。其他情况，可以通过 tuning garbage collector 来解决。操作系统的影响 SWAP 可能会显著增加 GC 时间，因为被换出的堆还要被换入。美团的实践参考：《从实际案例聊聊Java应用的GC优化》《Java中9种常见的CMS GC问题分析与解决》 Minor GC Major GC Full GC 垃圾收集器分类可以看到一个现象：在大部分时候，g1 比 CMS 快，但极端的百分位里，CMS 比 g1 快。出处见这里。常用工具命令行终端标准终端类：jps、jinfo、jstat、jstack、jmap 功能整合类：jcm...

2026-02-07

JVM 的内存模型与线程

JVM 的内存模型与线程 Java 内存模型（Java Memory Model, JMM）定义了多线程环境下共享变量的访问规则，是理解并发编程的基石。本文从硬件架构出发，逐步深入到 JMM 的核心机制与实践模式。 mindmap root((JMM)) 硬件基础 CPU缓存层次缓存一致性协议 JMM 抽象主内存 vs 工作内存八种内存操作 happens-before 关系关键保证原子性可见性有序性实践工具 volatile synchronized final 模式总览 # 模式名称一句话口诀适用场景 1 写刷读清写入即刷盘，读取先清空 volatile / unlock 后的可见性 2 顺序锁同把锁内，串行执行 synchronized 临界区保护 3 偏序传递 A先于B，B先于C，则A先于C happens-before 链式推理 4 不可变安全构造完成前...

适配器	所在类	输入	输出	使用场景
`FutureTask`	AbstractExecutorService	`Callable<T>` 或 `Runnable + T`	`RunnableFuture<T>`	`submit()` 返回 Future
`RunnableAdapter`	Executors	`Runnable + T`	`Callable<T>`	`submit(Runnable, T)` 内部转换
`AdaptedRunnable<T>`	ForkJoinTask	`Runnable + T`	`ForkJoinTask<T>`	ForkJoinPool 处理带返回值的 Runnable
`AdaptedRunnableAction`	ForkJoinTask	`Runnable`	`ForkJoinTask<Void>`	ForkJoinPool 处理无返回值 Runnable
`AdaptedCallable<T>`	ForkJoinTask	`Callable<T>`	`ForkJoinTask<T>`	ForkJoinPool 处理 Callable
`RunnableExecuteAdapter`	ForkJoinPool	`Runnable`	`ForkJoinTask<Void>`	ForkJoinPool.execute(Runnable)

从执行器到线程池（from executor interface to thread pool implementation）

本文模式总览

执行器继承体系

父子孙

Executor 接口

ExecutorService 接口

线程池的拒绝策略与线程中断机制

拒绝策略触发场景

线程中断触发场景

AbstractExecutorService

ThreadPoolExecutor

ScheduledExecutorService 接口

ScheduledThreadPoolExecutor 对 ThreadPoolExecutor 的扩展

ForkJoinPool

小结

AbstractExecutorService 详解

newTaskFor：任务包装的核心工厂方法

FutureTask：任务包装的标准实现

类型体系与设计定位

成员字段与构造

状态机

执行入口：run() 与 runAndReset()

run()

runner 的生命周期

Thread.start → Worker.run → runWorker → FutureTask.run 调用关系辨析

runAndReset()

三类终态方法：set / setException / cancel

set()：正常完成

setException()：异常完成

cancel()：取消/中断

cancel(true) vs cancel(false) 的语义差异

finishCompletion()：终态收尾

结果获取：get() / awaitDone() / report()

awaitDone()：自旋 + LockSupport.park 的阻塞等待

WaitNode：Treiber Stack 节点

removeWaiter()：清理超时/中断的等待节点

report()：终态到返回值/异常的转换

FutureTask 在线程池中的调用链路

invokeAll

两种针对 Runnable 的 submit

相关适配器一览

ThreadPoolExecutor

核心架构：ctl 与线程池状态机

ThreadPoolExecutor 如何管理任务

设计哲学：任务与线程解耦

任务提交入口：submit 与 execute

创建工作线程：addWorker

任务缓冲：阻塞队列

阻塞队列选型指南

ThreadPoolExecutor 任务拒绝

ThreadPoolExecutor 如何管理线程

术语定义：线程回收 vs 资源回收

mainLock：线程池的全局互斥锁

线程数保量机制

corePoolSize 的三重语义

线程增加路径

线程退出路径

allowCoreThreadTimeOut 的作用

结论

线程执行

Worker 类定义与锁状态

runWorker 主循环

SHUTDOWN 与 STOP 是两种平行的关闭策略

尝试关闭 ThreadPoolExecutor

生命周期钩子方法：beforeExecute / afterExecute / terminated

钩子方法定义与调用时机

典型应用场景

关键注意事项

钩子方法与状态机的关系

getTask 获取任务

线程回收

interruptIdleWorkers 中断空闲线程

线程销毁

processWorkerExit Worker 退出处理

常见问题与替代方案

调参的核心原则

替代方案对比

传统替代方案对比

现代Java并发框架对比

选择建议