Stream API 惰性求值与内部迭代

概述

系列：Java 语言深度内核系列③ 函数式编程与 Stream
上一篇 ：[《Lambda 表达式原理与函数式接口》](#《Lambda 表达式原理与函数式接口》 "#")
下一篇 ：[《Collectors 内部实现与自定义收集器》](#《Collectors 内部实现与自定义收集器》 "#")
建议阅读：已掌握 Lambda 原理与函数式接口，希望深入 Stream 内部机制

开篇衔接

前文《Lambda 表达式原理与函数式接口》完整揭示了 JDK 8 如何通过 invokedynamic 指令和 LambdaMetafactory 让 Lambda 在 JVM 上原生落地。Lambda 的引入不仅让代码更简洁，更重要的是它为 Stream API 提供了"可传递的行为"------filter(Predicate)、map(Function) 这些中间操作接受的参数正是函数式接口。如果说 Lambda 是"行为的抽象"，那么 Stream 就是"对数据应用行为的流水线"。本文将接续 Lambda 的认知，深入 Stream 流水线的内部------惰性求值的 Sink 责任链、短路操作的提前终止、有状态与无状态操作的差异。

"为什么 Stream 的中间操作不会立即执行？为什么 findFirst 之后 filter 不再遍历剩余元素？sorted 为什么在并行流中会退化性能？Stream 只能消费一次是怎么实现的？"

------这些问题的答案，藏在 Stream 源码的 Sink 接口和 AbstractPipeline 的 opWrapSink 方法中。大多数开发者每天都在用 stream().filter().map().collect()，却不知道从 filter 到 map 到 collect，中间构成了一个层层包装的 Sink 责任链。filter 的 Sink 包裹着 map 的 Sink，map 的 Sink 包裹着 collect 的终止 Sink。当 collect 触发执行时，元素从数据源出发，依次穿过 filter（被过滤的元素在此丢弃）、map（被转换的元素继续传递）、最终到达 collect 的终止 Sink。更精妙的是，短路操作的 Sink 通过 cancellationRequested 向上游传递"停止"信号，实现了 findFirst 无需遍历全部元素的效果。本文将从 Sink 接口的四方法契约开始，到 opWrapSink 的层层包装，再到 wrapAndCopyInto 的执行触发，完整拆解 Stream 惰性求值流水线的构建与执行全流程。

核心要点：

Stream 三大特性：不存数据、不修改源、惰性求值，内部迭代为并行化提供基础
Sink 责任链 ：中间操作通过 opWrapSink 层层包装 Sink，终止操作触发 begin → accept → end
短路操作 ：cancellationRequested 向上游传递停止信号，findFirst/limit 提前终止
有状态操作 ：sorted 缓存全部元素排序，distinct 用 HashSet 去重，内存占用 O(n)
Spliterator 分割 ：trySplit 分割为两个 Spliterator，为 parallelStream 提供任务分解基础
可消费一次：终止操作后 Stream 关闭，防止重复消费引发问题

文章组织架构：

flowchart TD A["1. Stream 三大特性 不存数据、不修改源 惰性求值、可消费一次"] --> B["2. 中间操作与终止操作 分类、无状态 vs 有状态 惰性 vs 触发"] B --> C["3. Sink 责任链构建 opWrapSink 层层包装 形成处理管道"] C --> D["4. 终止操作触发执行 wrapAndCopyInto begin → accept → end"] D --> E["5. 短路操作 cancellationRequested 向上游传递停止信号"] E --> F["6. 有状态操作实现 sorted 全量缓存 distinct HashSet 去重"] F --> G["7. Spliterator trySplit 分割遍历 parallelStream 并行预埋"] classDef start fill:#e0e8f0,stroke:#8ba0aa,stroke-width:1.5px,color:#1e293b classDef middle fill:#ece8e0,stroke:#b0a088,stroke-width:1.5px,color:#1e293b classDef advanced fill:#e0d9f0,stroke:#8b7aa8,stroke-width:1.5px,color:#1e293b classDef parallel fill:#d9e5d6,stroke:#8ba0aa,stroke-width:1.5px,color:#1e293b class A,B start class C,D middle class E,F advanced class G parallel

分层说明 ：模块 1-2 建立 Stream 的宏观认知------特性和操作分类；模块 3-4 是全文核心------Sink 责任链的构建与执行触发；模块 5-6 是两个关键机制的深入------短路和有状态操作；模块 7 预埋并行流的 Spliterator 基础。关键结论：Stream 的惰性求值不是魔法，而是 Sink 责任链 + 终止操作触发的设计结果。中间操作构建 Sink 链（opWrapSink），终止操作触发执行（wrapAndCopyInto），元素从数据源出发依次穿过每个 Sink 的 accept 方法。短路操作通过 cancellationRequested 向上游传递停止信号，有状态操作在 begin/end 中完成全量缓存和排序。理解 Sink 责任链，才能理解为什么 Stream 的中间操作可以灵活组合、为什么短路操作能提前终止、以及为什么 sorted 在并行流中性能退化。

1. Stream 三大特性：不存数据、不修改源、惰性求值、可消费一次

1.1 不存数据：Stream 是视图，而非容器

Stream 本身并不存储任何元素。它不是一个数据结构，而是对数据源（集合、数组、I/O 通道、生成器函数等）的一个操作视图。在 java.util.stream.Stream 接口的 Javadoc 中明确写道：

"A stream is not a data structure that stores elements; instead, it conveys elements from a source through a pipeline of computational operations."

在源码层面，AbstractPipeline（所有 Stream 实现的抽象基类）持有数据源的引用 sourceSpliterator，这是一个 Spliterator 对象，负责遍历数据源元素。Stream 自己仅持有：

源 Spliterator（数据入口）
前一个 Stage 的引用 previousStage（构建流水线链）
操作标志 sourceOrOpFlags（优化策略标记）

也就是说，list.stream().filter(...) 并不会复制 list 的数据，它只是在 ArrayList 的 Spliterator 上挂载了一个"过滤"的操作描述。数据仍在 list 中，Stream 只在遍历时才按需拉取。

1.2 不修改源：函数式不可变性

中间操作（如 filter、map）总是返回一个新的 Stream 对象，原数据源保持不变。这是函数式编程中不可变性的体现。例如：

java 复制代码

List<String> original = Arrays.asList("a", "b", "c");
List<String> result = original.stream()
        .filter(s -> !s.equals("b"))
        .collect(Collectors.toList());
// original 仍然是 ["a", "b", "c"]

在实现上，filter 返回的 StatelessOp 内部只记录了过滤条件 Predicate，它持有的 sourceSpliterator 依然指向原始集合的 Spliterator。只有当终止操作执行时，Spliterator 才会遍历元素，元素在流经 Sink 链的过程中可能被丢弃或转换，但原始集合不受任何影响。

1.3 惰性求值：中间操作仅构建蓝图

惰性求值是 Stream 最核心的特性。任何中间操作（filter、map、sorted 等）都不会立即执行遍历。它们只做一件事：创建一个新的 Stream 节点，并通过 opWrapSink 方法生成一个 Sink，串联到已有的 Sink 责任链上。真正的遍历动作由终止操作触发。

例如以下代码：

java 复制代码

Stream<String> s = list.stream()
        .filter(x -> {
            System.out.println("filter: " + x);
            return x.startsWith("A");
        })
        .map(x -> {
            System.out.println("map: " + x);
            return x.toLowerCase();
        });
System.out.println("Stream pipeline built, no element processed yet.");
// 直到此时，控制台不会有任何 filter 或 map 的输出
List<String> result = s.collect(Collectors.toList());
// 此时 filter 和 map 的打印才会出现

在 collect 调用之前，JVM 仅仅构造了 ReferencePipeline 链表：Head -> StatelessOp(filter) -> StatelessOp(map)。每个节点内部的 opWrapSink 还没有被调用，Sink 链尚未构建。这个特性带来的好处是巨大的：

性能优化：可以融合操作（loop fusion），避免多次遍历。
短路支持：可以提前终止遍历。
并行友好：任务拆分和惰性求值天然适配。

1.4 可消费一次：Stream 关闭与重用检测

一个 Stream 实例只能被消费一次。调用终止操作后，该 Stream 会被标记为"已操作"，再次调用终止操作将抛出 IllegalStateException：

java 复制代码

Stream<String> s = list.stream();
s.collect(Collectors.toList());
s.collect(Collectors.toList()); // 抛出 IllegalStateException: stream has already been operated upon or closed

在 AbstractPipeline 中，所有终止操作（如 evaluate 方法）在执行前会调用 sourceSpliterator 进行检测，核心逻辑如下：

java 复制代码

// AbstractPipeline.java (简化)
final <R> R evaluate(TerminalOp<E_OUT, R> terminalOp) {
    if (linkedOrConsumed)
        throw new IllegalStateException(MSG_STREAM_LINKED);
    linkedOrConsumed = true;
    // ...执行流水线
}

linkedOrConsumed 是一个布尔标志，初始为 false，一旦执行过终止操作便设为 true。这个限制背后的设计理由是：大部分 Stream 的数据源 Spliterator 只能遍历一次（例如从 I/O 通道读取的流），且惰性求值意味着 Stream 自身不缓存元素（除非有状态操作显式缓存），因此重复消费无法保证正确性，甚至会导致资源泄漏或死循环。这一约束也强制开发者以声明式的方式一次性完成数据处理，符合函数式编程的"无副作用"原则。

1.5 内部迭代 vs 外部迭代

对比维度	外部迭代 (for-each/iterator)	内部迭代 (Stream)
控制权	调用者控制遍历逻辑、顺序、终止条件	库控制整个遍历过程
并行支持	需要手动处理线程安全	内部迭代自然支持并行拆分
优化能力	有限（编译器难以优化显式循环）	可进行循环融合、短路优化
可组合性	需要嵌套循环或临时变量传递中间结果	链式调用，清晰声明式

内部迭代为惰性求值、短路和并行化提供了实现基础：因为遍历是由库来驱动的，库可以在遍历过程中插入任意逻辑（如检测 cancellationRequested、进行 Spliterator 分割），而调用者无需关心。

下面插入第一张图：Stream 惰性求值原理图。

flowchart TD subgraph 构建阶段 direction LR A[数据源 List/Set/Array] --> B[Stream 创建 stream/split] B --> C[中间操作 filter/map/sorted 构建新 Stream 节点 记录操作逻辑] C --> D[中间操作 distinct/limit 继续追加节点] D --> E[中间操作链完成 Sink 链尚未构建 无元素遍历] end subgraph 执行阶段 direction LR E --> F[终止操作 collect/reduce/forEach] F --> G[触发 Sink 链构建 opWrapSink 层层包装] G --> H[遍历数据源 Spliterator 逐个投递元素] H --> I[Sink 责任链处理 accept 层层传递] I --> J[返回最终结果] end style 构建阶段 fill:#e3f2fd,stroke:#1565c0 style 执行阶段 fill:#ffebee,stroke:#c62828

a) 主旨概括 ：该图展示了 Stream 流水线的两个截然不同的阶段：构建阶段（蓝色） 仅建立操作蓝图，不执行任何元素处理；执行阶段（红色） 由终止操作触发，一次性完成遍历、计算与结果返回。

b) 逐元素分解 ：构建阶段中，每个中间操作返回一个持有上下游引用的新 AbstractPipeline 节点。执行阶段开始时，wrapAndCopyInto 或 evaluate 会首先调用 opWrapSink 从下游到上游逐层包装 Sink，形成完整处理链，然后驱动 Spliterator 遍历数据源，元素进入 Sink 链直至收集结果。

c) 设计原理映射 ：这种"两阶段"设计实现了惰性求值 和循环融合。构建阶段零成本地组合任意多个操作，执行阶段只需一次遍历即可完成所有操作，极大减少了不必要的中间集合生成和迭代次数。

d) 工程联系与关键结论 ：理解这一原理对性能调优至关重要。例如在循环中进行多次 stream() 操作会产生多次完整遍历，而合理使用 filter-map-collect 链只需一次遍历。惰性求值不是延迟执行那么简单，它是 Stream 高性能的基石。

2. 中间操作与终止操作：分类、无状态 vs 有状态、惰性 vs 触发

2.1 中间操作

中间操作返回一个 新的 Stream 实例，描述了对数据源应用的转换步骤。它们都是惰性的，在终止操作触发前仅构建流水线结构。关键中间操作如下：

过滤型 ：filter(Predicate) --- 保留满足条件的元素
映射型 ：map(Function) --- 元素一对一转换；flatMap(Function) --- 元素一对多展开
窥视型 ：peek(Consumer) --- 用于调试，对每个元素执行副作用
截断型 ：limit(long n) --- 截取前 n 个元素；skip(long n) --- 丢弃前 n 个元素
排序去重型 ：sorted() / sorted(Comparator) --- 排序；distinct() --- 去重

在 ReferencePipeline 中，每个中间操作都会创建一个新的 StatelessOp 或 StatefulOp 实例。例如 filter：

java 复制代码

// ReferencePipeline.java
public final Stream<P_OUT> filter(Predicate<? super P_OUT> predicate) {
    Objects.requireNonNull(predicate);
    return new StatelessOp<P_OUT, P_OUT>(this, StreamShape.REFERENCE,
                                         StreamOpFlag.NOT_SIZED) {
        @Override
        Sink<P_OUT> opWrapSink(int flags, Sink<P_OUT> sink) {
            return new Sink.ChainedReference<P_OUT, P_OUT>(sink) {
                @Override
                public void accept(P_OUT u) {
                    if (predicate.test(u))
                        downstream.accept(u);
                }
            };
        }
    };
}

可以看到，filter 只做了两件事：

创建一个 StatelessOp，设置流形态和标志位（NOT_SIZED 表示过滤后元素数量未知）。
覆写 opWrapSink 方法，该方法在终止操作触发时被调用，用于构建 Sink 链。

中间操作的返回类型 始终是 Stream，这保证了链式调用的流畅 API。

2.2 终止操作

终止操作不再返回 Stream，而是产生最终结果（如 List、Optional、数值）或执行副作用（forEach）。它们会触发流水线的实际执行，执行后 Stream 关闭。关键终止操作：

归约型 ：reduce(identity, accumulator) --- 二元归约；count() --- 计数；min() / max() --- 极值
收集型 ：collect(Collector) --- 收集到集合/Map/字符串等
短路终止型 ：findFirst() / findAny() --- 查找首个/任意元素；anyMatch() / allMatch() / noneMatch() --- 匹配
副作用型 ：forEach(Consumer) / forEachOrdered(Consumer) --- 遍历执行副作用

终止操作在 AbstractPipeline 中通过 evaluate 方法执行：

java 复制代码

// AbstractPipeline.java
final <R> R evaluate(TerminalOp<E_OUT, R> terminalOp) {
    if (linkedOrConsumed)
        throw new IllegalStateException(MSG_STREAM_LINKED);
    linkedOrConsumed = true;
    return isParallel()
           ? terminalOp.evaluateParallel(this, sourceSpliterator(terminalOp.getOpFlags()))
           : terminalOp.evaluateSequential(this, sourceSpliterator(terminalOp.getOpFlags()));
}

2.3 无状态操作 vs 有状态操作

中间操作可以按是否需要"跨元素信息"分为两类，这在并行和内存消耗上有深远影响：

分类	操作	特性	内存占用	并行友好度
无状态	`map`, `filter`, `flatMap`, `peek`	每个元素独立处理，不需要其他元素信息	O(1)	高，可自由拆分
有状态	`sorted`, `distinct`	处理一个元素时需要访问其他元素	O(n)	低，需全局同步

limit 和 skip 的状态依赖较特殊：limit 需要记录已处理的元素数量（计数器），但不需要缓存元素本身，内存占用 O(1)；skip 同样只需计数。它们通常被归类为"短状态"操作，但在源码中 limit 也基于有状态的 Sink 实现。

有状态操作对并行流的影响 ：sorted 在并行流中需要先将所有子任务的结果收集到数组中，然后进行全局排序，这会引入额外的合并开销。distinct 在并行流中通常使用全局的 ConcurrentHashMap 判重，但可能导致线程竞争。这些会在第 6 节详细展开。

3. Sink 责任链构建：opWrapSink 层层包装，形成处理管道

Sink 责任链是整个 Stream 流水线执行机制的灵魂。它定义了元素在流水线中的处理契约和传递方式。

3.1 Sink 接口：四方法生命周期

Sink<T> 接口位于 java.util.stream 包中，继承自 Consumer<T>，其定义了四个核心方法：

java 复制代码

interface Sink<T> extends Consumer<T> {
    // 1. 初始化：接收元素总数（可能是估算值），在 accept 之前调用一次
    void begin(long size);
    // 2. 处理单个元素：由上游 Sink 调用，实现元素处理逻辑
    void accept(T t);
    // 3. 结束通知：所有元素处理完毕后调用一次，用于清理或最终化操作
    void end();
    // 4. 短路检测：返回 true 表示请求上游停止投递元素
    boolean cancellationRequested();
}

这四个方法定义了每个 Sink 节点的完整生命周期：

begin(long size) ：在遍历开始前调用，传递数据源的元素数量（可能是精确值或估算值 -1）。sorted 会在此初始化存放元素的数组，distinct 会在此初始化 HashSet，无状态操作通常忽略此信息。
accept(T t) ：核心处理方法，被上游 Sink 的 accept 调用（或由 Spliterator 直接调用）。filter 的 accept 中会执行 predicate.test(t) 并根据结果决定是否调用 downstream.accept(t)。
end() ：遍历结束后调用。sorted 在此对缓存数组排序并逐一投递给下游，distinct 一般无需操作。
cancellationRequested() ：短路信号。limit 的 Sink 在达到限制条数后将此标志设为 true；findFirst 在找到匹配元素后设为 true。上游循环在每次调用 accept 前后检查此标志。

3.2 opWrapSink 与 Sink 链的构建

每个中间操作都必须实现 opWrapSink(int flags, Sink<E_OUT> downstream) 方法。flags 是上游传递下来的流标志位组合 （如 SIZED、ORDERED、DISTINCT 等），供当前操作优化决策；downstream 是下游的 Sink，即当前操作处理后元素应传递到的下一个 Sink。

终止操作在触发执行时，会调用 AbstractPipeline.wrapSink 方法，该方法从下游到上游逐层调用 opWrapSink，构建完整的 Sink 链。伪代码表示：

java 复制代码

// 从终止操作 Sink 开始，向上游包装
Sink wrappedSink = terminalSink;
for (AbstractPipeline stage = lastStage; stage != head; stage = stage.previousStage) {
    wrappedSink = stage.opWrapSink(stage.sourceOrOpFlags, wrappedSink);
}

以 stream.filter(...).map(...).collect(toList()) 为例：

collect 创建一个终止 Sink（如 ReducingSink，内部持有 ArrayList）。
调用 map 的 opWrapSink，传入 flags 和 ReducingSink，map 返回一个新的 Sink：Sink { accept: downstream.accept(mapper.apply(t)) }，它内部持有 ReducingSink。
调用 filter 的 opWrapSink，传入 flags 和 map 的 Sink，filter 返回一个新的 Sink：Sink { accept: if (predicate.test(t)) downstream.accept(t) }，它内部持有 map 的 Sink。

最终形成的链：

rust 复制代码

filterSink -> mapSink -> reducingSink (收集到List)

元素流经时：

filterSink.accept(t) → 如果满足条件，调用 mapSink.accept(t) → mapSink 将元素转换后调用 reducingSink.accept(mapped)。

这种设计使得每个操作都只需要关心自己和下游 Sink，无需了解整条链的结构，实现了高度的模块化和可组合性。

3.3 ChainedReference 等内部类

在 Sink 接口内部提供了两个重要的抽象类：

Sink.ChainedReference<T, E_OUT> ：为无状态操作设计，内部持有 downstream Sink，并提供了默认的 begin、end、cancellationRequested 实现，全部转发给下游。
Sink.ChainedInt、ChainedLong、ChainedDouble：类似，用于原始类型流。

filter 和 map 的匿名 Sink 均扩展自 ChainedReference。其源码结构（简化）：

java 复制代码

abstract static class ChainedReference<T, E_OUT> implements Sink<T> {
    protected final Sink<? super E_OUT> downstream;
    public ChainedReference(Sink<? super E_OUT> downstream) {
        this.downstream = Objects.requireNonNull(downstream);
    }
    @Override public void begin(long size) { downstream.begin(size); }
    @Override public void end() { downstream.end(); }
    @Override public boolean cancellationRequested() { return downstream.cancellationRequested(); }
}

有状态操作则需要管理自己的状态，因此通常不继承 ChainedReference，而是直接实现 Sink 接口并管理自己的生命周期，例如 SortedOps.SizedRefSortingSink 和 DistinctOps.DistinctSink。

接下来插入第二张图：Sink 责任链构建示意图。

flowchart LR subgraph 终止操作触发构建 T[Terminal Sink ReducingSink 收集到 List] M[map opWrapSink 创建 MapSink 持有 ReducingSink] F[filter opWrapSink 创建 FilterSink 持有 MapSink] S[源 Spliterator 遍历数据源] end T -- 作为下游传入 --> M M -- 作为下游传入 --> F F -- 接受元素 --> S S -- accept t --> F F -- 满足条件则 accept t --> M M -- accept mapped --> T

a) 主旨概括 ：该图展示了 filter → map → collect 流水线中 Sink 责任链的构建过程，自下游至上游逐层包装，每个 Sink 只持有对下游 Sink 的引用。

b) 逐元素分解 ：终止操作 collect 先生成 ReducingSink，然后 map 包装它生成 MapSink，接着 filter 再包装生成 FilterSink。当 Spliterator 遍历元素调用 FilterSink.accept(t) 时，FilterSink 仅将满足条件的元素传递给 MapSink，MapSink 转换后交给 ReducingSink 收集。

c) 设计原理映射 ：这种责任链模式 允许中间操作的无限制组合，每个操作独立实现，互不干扰。通过统一的生命周期方法（begin、end），有状态操作可以在适当时机进行初始化与最终化，而无状态操作则可简单转发。这是 Stream 灵活性的底层支柱。

d) 工程联系与关键结论 ：理解 Sink 链构建有助于排查流水线中的副作用问题。例如在 peek 中修改外部状态，由于 peek 的 Sink 在执行时才被调用，必须确保此时外部状态处于预期状态。Sink 链的构建是完全惰性的，只有终止操作才将其变为可执行的处理管道。

4. 终止操作触发执行：wrapAndCopyInto 的 begin → accept → end 流程

4.1 触发入口：evaluate 与 wrapAndCopyInto

所有终止操作的最终执行入口都在 AbstractPipeline 或其子类 ReferencePipeline 中。以 collect 为例，调用链为：

scss 复制代码

collect(Collector) → TerminalOp.evaluateSequential(this, sourceSpliterator) 
→ AbstractPipeline.wrapAndCopyInto(Sink, Spliterator)

wrapAndCopyInto 方法（JDK 8 中实际为 wrapAndCopyInto 与相关方法）完成三项关键工作：

java 复制代码

// ReferencePipeline.java (简化)
final <P_IN> void copyInto(Sink<P_IN> wrappedSink, Spliterator<P_IN> spliterator) {
    wrappedSink.begin(spliterator.getExactSizeIfKnown());
    spliterator.forEachRemaining(wrappedSink);
    wrappedSink.end();
}

// 在 wrapAndCopyInto 中先构建 Sink 链，再调用 copyInto

4.2 生命周期详解：begin(size) → accept(t) × N → end()

4.2.1 begin(size)

wrappedSink.begin(size) 会从最上游的 Sink 开始，逐层向下调用 begin，直到终止 Sink。每个有状态操作在 begin 中进行资源分配：

sorted 的 Sink：创建 ArrayList 用于缓存所有元素，size 参数用于指定初始容量（若已知）。
distinct 的 Sink：创建 HashSet 用于判重。
map、filter 等无状态操作的 Sink：通常直接转发 downstream.begin(size)。

注意，如果数据源的 estimateSize 返回 -1（未知大小），begin 会收到 -1。有状态操作此时会使用默认初始容量。

4.2.2 accept(t) --- 逐元素处理

Spliterator.forEachRemaining(wrappedSink) 调用最上游 Sink 的 accept 方法，元素开始沿 Sink 链流动。流程举例（filter → map → collect）：

Spliterator 获取元素 "Hello"，调用 FilterSink.accept("Hello")。
FilterSink 执行 predicate.test("Hello") → 假设为 true，调用 downstream.accept("Hello")（即 MapSink.accept）。
MapSink 执行 mapper.apply("Hello") → 得到 "hello"，调用 downstream.accept("hello")（即 ReducingSink.accept）。
ReducingSink 将 "hello" 加入内部 ArrayList。

如果有状态操作 sorted，它的 accept 只会将元素添加到缓存数组，不会调用 downstream.accept。此时元素传递被阻断 ，直到 end 阶段。

4.2.3 end() --- 结束与清理

遍历完成后，调用 wrappedSink.end()。该方法从最上游 Sink 向下游逐层调用：

sorted 的 Sink 在 end 中对缓存数组排序，然后遍历排序结果，对每个元素调用 downstream.accept，从而实现排序后传递。
distinct 的 Sink 通常无需特殊清理。
无状态操作直接转发 end 调用。

终止 Sink 的 end 通常用于返回最终结果。collect 的 ReducingSink 在构造时关联了一个 Collector，其 finisher 函数在 end 后由 collect 方法调用。

4.2.4 获取结果

copyInto 执行完后，终止操作会从终止 Sink 中取出结果。例如 collect 会调用 collector.finisher() 得到最终集合。

下面插入第三张图：Sink 接口四方法生命周期图。

flowchart TD A[Spliterator 遍历开始] --> B[wrappedSink.begin 传递元素总数 size] B --> C{size 已知?} C -- 是 --> D[有状态 Sink 预分配资源 如 ArrayList 初始化容量] C -- 否 --> E[使用默认容量 或忽略 size] D --> F[开始遍历元素 forEachRemaining] E --> F F --> G[每元素调用 wrappedSink.accept] G --> H{cancellationRequested?} H -- false --> I[元素沿 Sink 链传递 filter -> map -> terminal] I --> F H -- true --> J[停止遍历 提前退出] J --> K[wrappedSink.end] I --> L[遍历完毕] L --> K K --> M[有状态 Sink 执行最终化 如 sorted 排序后投递] M --> N[终止 Sink 返回结果] style B fill:#e1f5fe style G fill:#fff9c4 style K fill:#f3e5f5

a) 主旨概括 ：该图描述了从 begin 初始化、accept 循环处理、到 end 收尾的完整生命周期，并突出了 cancellationRequested 短路信号的检测点。

b) 逐元素分解 ：begin 阶段为有状态操作提供预分配窗口；accept 阶段每个元素沿责任链传递，短路信号可随时中断循环；end 阶段触发排序等延迟操作并最终返回结果。整个流程由终止操作驱动，Spliterator 充当数据泵。

c) 设计原理映射 ：将流水线执行分解为三阶段，使得 Stream 可以无缝支持无状态、有状态及短路操作。有状态操作将处理延迟到 end，确保了在排序前所有元素均已被缓存；短路操作在 accept 循环中实时检测，最大化避免无效遍历。

d) 工程联系与关键结论 ：理解三阶段生命周期对调试 Stream 性能问题很重要。例如 sorted 之后紧跟 findFirst 会导致全部元素被排序，完全丧失了短路优化的机会。操作顺序至关重要，正确的操作编排可以大幅提升效率。

5. 短路操作：cancellationRequested 向上游传递停止信号

5.1 短路操作的类型与意义

Stream 提供了几个关键的短路操作，它们允许在找到满足条件的元素或达到指定限制后立即终止遍历，无需处理剩余元素：

limit(n)：当已收集元素数量达到 n 时短路。
findFirst()：找到第一个元素（在顺序流中）后短路。
findAny() ：在并行流中任意找到匹配元素即短路（顺序流中效果同 findFirst）。
anyMatch(Predicate) ：有一个元素满足即短路；allMatch 遇到不满足即短路；noneMatch 遇到满足即短路。

这些操作在 Sink 层面通过 cancellationRequested() 方法实现向上游传播停止信号。

5.2 cancellationRequested 机制

Sink.cancellationRequested() 默认返回 false。在短路操作的 Sink 内部，一旦达到终止条件，该方法返回 true。以 limit 为例：

java 复制代码

// SliceOps.java (limit Sink 简化)
private static final class LimitSink<T> implements Sink<T> {
    private final Sink<T> downstream;
    private long remaining;
    LimitSink(Sink<T> downstream, long limit) {
        this.downstream = downstream;
        this.remaining = limit;
    }
    @Override
    public void begin(long size) {
        downstream.begin(size);
    }
    @Override
    public void accept(T t) {
        if (remaining > 0) {
            remaining--;
            downstream.accept(t);
        }
    }
    @Override
    public boolean cancellationRequested() {
        return remaining == 0;
    }
    @Override
    public void end() {
        downstream.end();
    }
}

当 remaining 减至 0 时，cancellationRequested() 开始返回 true。那么这个信号如何终止遍历呢？

在 copyInto 或类似的遍历循环中（具体实现在 AbstractTask 或 ForEachOps 等），遍历 Spliterator 的循环会持续检查 cancellationRequested。但在典型的顺序流 collect/forEach 场景中，copyInto 使用的是 spliterator.forEachRemaining(wrappedSink)，该方法内部并不会主动检查 cancellationRequested()。真正实现短路遍历的关键在于 Spliterator 的实现策略以及 Sink 链内部的主动截断。

在 JDK 8 中，forEachRemaining 对于 ArrayListSpliterator 等数组结构的 Spliterator 通常会一次性批量遍历所有元素（使用 for 循环），此时 cancellationRequested 无法被检测，那么 limit 是如何停止遍历的呢？答案是：limit 的 accept 方法在 remaining == 0 后直接丢弃后续元素，不再调用 downstream.accept，从而阻止了元素向下游传递。但源 Spliterator 仍然会遍历所有元素。

然而，如果使用 iterator 遍历或者某些支持取消的 Spliterator，则可以在元素投递前检测 cancellationRequested。例如在 ForEachOps 中，遍历代码类似：

java 复制代码

// 简化示例
Spliterator<T> spliterator = ...;
Sink<T> sink = wrappedSink;
sink.begin(spliterator.getExactSizeIfKnown());
spliterator.forEachRemaining(e -> {
    sink.accept(e);
    if (sink.cancellationRequested())
        // 此处本应 break，但 forEachRemaining 内部无法 break
        // 因此实际上对于批量遍历，cancellationRequested 并不减少遍历次数
});

关键结论 ：在 JDK 8 的顺序流中，limit、findFirst 等操作并不减少源 Spliterator 的遍历元素数量 ，它们只阻止元素传递到下游及终止 Sink。真正的提前终止遍历发生在并行流 的 ForkJoinTask 分解中，以及部分 Spliterator 实现（如 IntStream.range 生成的 Spliterator）在 tryAdvance 时会检查取消标志。源码中 AbstractShortcutTask（并行流中的短路任务）利用了 cancellationRequested 来取消兄弟任务的执行，这是更有效的提前终止。

但在顺序流中，即便 Spliterator 会遍历全部元素，短路操作仍然通过丢弃后续 accept 调用 实现了效果等价，并且由于不再执行下游昂贵的操作（如 map、filter 的 Lambda），性能依然优于全量处理。

5.3 短路信号在 Sink 链中的传播

ChainedReference 的 cancellationRequested() 默认转发给下游。这意味着如果一个短路操作位于终止位置（如 findFirst），其 Sink 的 cancellationRequested 返回 true 后，上游的无状态 Sink 在调用 downstream.cancellationRequested() 时就能感知到。虽然顺序遍历循环可能不主动检测，但在并行流的 compute() 方法中，任务会检查 cancellationRequested 并提前返回，从而避免进一步拆分和计算。

下面插入第四张图：短路操作 cancellationRequested 传递图。

flowchart TD A[Spliterator 遍历元素] --> B[调用 filter Sink.accept predicate.test 通过] B --> C[调用 map Sink.accept 元素转换] C --> D[调用 findFirst Sink.accept 发现第一个匹配元素] D --> E[findFirst Sink 设置 cancellationRequested = true] E --> F[上游 filter 在循环中检测 downstream.cancellationRequested?] F -- true --> G[停止继续投递元素 提前退出循环] F -- false --> H[继续投递下一个元素] style E fill:#ffcdd2 style G fill:#c8e6c9

a) 主旨概括 ：该图展示了 findFirst 终止操作在找到第一个元素后，如何通过 cancellationRequested 信号让上游停止元素投递，实现提前终止。

b) 逐元素分解 ：当 findFirst 的 Sink 接收第一个满足条件的元素后，其内部的 cancellationRequested 标记被置为 true。上游的 filter 或 map Sink 由于继承了 ChainedReference，其 cancellationRequested() 会转发这一信号。在支持取消的遍历循环中（例如并行流），检测到此信号即终止遍历。

c) 设计原理映射：通过一个简单的布尔标志在 Sink 链中向下游向上游反向传播停止请求，实现了流式处理的优雅短路。这避免了在整个流水线中引入异常或复杂的中断机制，保证了链式调用的简单性。

d) 工程联系与关键结论 ：在编写自定义收集器或使用 flatMap 产生大量元素时，配合 limit 使用可有效控制数据量，避免不必要的处理。但需注意，顺序流中短路操作不一定减少源遍历量，它主要避免了下游计算和终止操作的执行。真正减少遍历需要并行流或特定 Spliterator 支持。

6. 有状态操作实现：sorted（全量缓存）与 distinct（HashSet 去重）

6.1 sorted 的完整实现剖析

Stream.sorted() 返回一个 SortedOps.OfRef 或 SortedOps.SizedRefSortingSink。其 Sink 实现体现了典型的有状态操作模式：begin 分配缓存，accept 收集元素，end 排序并投递给下游。

核心源码（简化自 SortedOps.java）：

java 复制代码

private static final class SizedRefSortingSink<T> extends AbstractRefSortingSink<T> {
    private T[] array;
    private int offset;

    SizedRefSortingSink(Sink<? super T> downstream, Comparator<? super T> comparator) {
        super(downstream, comparator);
    }

    @Override
    public void begin(long size) {
        if (size >= Nodes.MAX_ARRAY_SIZE)
            throw new IllegalArgumentException("Stream size exceeds max array size");
        // 根据 size 创建数组，如果未知 size 则使用默认大小，后续可能扩容
        array = (T[]) new Object[(int) size];
    }

    @Override
    public void accept(T t) {
        array[offset++] = t;    // 只缓存，不向下游传递
    }

    @Override
    public void end() {
        Arrays.sort(array, 0, offset, comparator);   // 排序
        downstream.begin(offset);                    // 通知下游元素数量
        for (int i = 0; i < offset; i++) {
            downstream.accept(array[i]);             // 逐个投递
        }
        downstream.end();
        array = null;
    }
}

执行流程：

begin(size)：创建大小固定的数组（若 size 准确，可避免扩容；否则使用默认容量并在 accept 中动态扩容）。
accept(t)：仅将元素存入数组，不调用 downstream.accept 。这意味着元素流在此处被截断，下游 Sink（如 map）不会在排序阶段收到任何元素。
end()：调用 Arrays.sort 对缓存数组排序，然后通知下游 begin(offset)，再遍历排序后数组，对每个元素调用 downstream.accept，最后 downstream.end()。

这种"缓存-排序-重放"的模式带来了 O(n) 的内存占用 ，并且要求全部元素到达后才能产生第一个输出 ，这也就是为什么 sorted 之后接 findFirst 会失去短路优势------因为排序操作必须消费全部元素。

6.2 distinct 的 HashSet 判重

distinct() 的实现位于 DistinctOps，其 Sink 使用 HashSet （或 LinkedHashSet 以保持顺序）来记录已见过的元素。

简化源码：

java 复制代码

private static final class DistinctSink<T> implements Sink<T> {
    private final Sink<T> downstream;
    private Set<T> seen;

    DistinctSink(Sink<T> downstream) {
        this.downstream = downstream;
    }

    @Override
    public void begin(long size) {
        // 根据 size 估算 HashSet 初始容量
        seen = new HashSet<>((size >= 0) ? (int)(size / 0.75f + 1) : 16);
        downstream.begin(-1);  // 大小未知
    }

    @Override
    public void accept(T t) {
        if (!seen.contains(t)) {
            seen.add(t);
            downstream.accept(t);
        }
    }

    @Override
    public void end() {
        seen = null;
        downstream.end();
    }
}

distinct 在 accept 阶段就实时判重并投递，因此不需要等到 end。但它的状态（HashSet）依然是跨元素共享的，属于有状态操作。内存占用 O(n)，且并行流中通常使用 ConcurrentHashMap 以实现线程安全。

6.3 有状态操作对并行流的限制

并行流中，sorted 会经历更复杂的流程：每个子任务先对自己的分段进行排序，然后通过 Arrays.parallelSort 或归并排序合并。这涉及到 SortedOps 中 opEvaluateParallel 的实现，它使用 ForkJoinPool 并行化排序与合并。但无论如何，并行排序本身仍然需要全量数据，并且合并阶段存在同步开销。

distinct 在并行流中通常使用 DistinctOps 提供的并行策略，借助 ConcurrentHashMap 或基于 AtomicBoolean 的标记数组（当元素可哈希为有限域时），这可能导致较高的并发竞争。

接下来插入第五张图：有状态操作 sorted 实现流程图。

flowchart TD A[begin 调用] --> B[创建 ArrayList 或数组 预分配 size 容量] B --> C[accept 逐元素调用] C --> D[将元素添加到缓存 不调用 downstream.accept] D --> E{是否还有元素?} E -- 是 --> C E -- 否 --> F[end 调用] F --> G[对缓存数组排序 Arrays.sort] G --> H[调用 downstream.begin 传递排序后元素数量] H --> I[遍历排序后数组 调用 downstream.accept] I --> J[调用 downstream.end] J --> K[释放缓存数组] style B fill:#e1f5fe style D fill:#fff9c4 style G fill:#ffcdd2

a) 主旨概括 ：该图展示了 sorted 操作 Sink 的三阶段行为，特别强调元素在 accept 时被暂存，直到 end 才排序并向下游释放，实现了全量排序的效果。

b) 逐元素分解 ：begin 预分配数组，accept 仅存储，end 排序后主动遍历并调用 downstream.accept，完全控制了元素向下游流动的时机。下游 Sink 在 sorted 调用 end 之前不会收到任何元素。

c) 设计原理映射 ：这种"缓存-处理-重放"模式是有状态操作的标准范式。它将 end 作为阶段转换点，使得无状态操作无需关心上游的状态依赖，保证了整个 Sink 链的协议统一性。

d) 工程联系与关键结论 ：由于 sorted 强制消费整个流并缓存，对于无限流或超大数据源，它会导致 OutOfMemoryError。处理大集合时，应避免不必要的全局排序，优先考虑使用 limit 截断，或者采用基于 TreeSet 的 Collector 进行排序去重。

7. Spliterator：trySplit 分割遍历与 parallelStream 并行预埋

7.1 Spliterator 接口概览

java.util.Spliterator<T> 是 JDK 8 引入的用于遍历和分割元素的接口，其名称意为"可分割的迭代器"。它提供了四个关键方法：

boolean tryAdvance(Consumer<? super T> action) ：逐个处理元素，如果存在剩余元素则执行 action 并返回 true，否则返回 false。类似于 Iterator.next() 加 hasNext() 的组合。
Spliterator<T> trySplit() ：尝试将当前 Spliterator 分割为两个，返回一个新的 Spliterator 覆盖元素的前半部分，原 Spliterator 保留后半部分。如果无法分割则返回 null。
long estimateSize() ：估算剩余元素数量，若无法估算则返回 Long.MAX_VALUE。
int characteristics() ：返回特性标记位组合，用于优化。例如 ORDERED（元素有定义顺序）、DISTINCT（无重复）、SORTED（遵循排序）、SIZED（精确大小已知）、SUBSIZED（分割后的子 Spliterator 也精确已知大小）、IMMUTABLE（不可变数据源）等。

7.2 Spliterator vs Iterator

特性	Iterator	Spliterator
遍历方式	`hasNext()` + `next()` 外部迭代	`tryAdvance` 内部迭代
并行支持	不支持拆分	`trySplit` 支持将数据源分割为多份
元数据信息	无	`characteristics()` 提供优化线索
批量操作	无原生支持	`forEachRemaining` 批量处理
来源	集合通用	专门为 Stream 和并行设计

Spliterator 的分割能力是实现并行流的基础。parallelStream 通过不断调用 trySplit 将数据源递归切分为小任务，提交给 ForkJoinPool 并行执行。

7.3 ArrayListSpliterator 分割实例

以 ArrayList 的 Spliterator 为例，其分割是基于数组索引的二分：

java 复制代码

// ArrayList.java
static final class ArrayListSpliterator<E> implements Spliterator<E> {
    private final ArrayList<E> list;
    private int index;   // 当前起始位置
    private int fence;   // 结束位置（使用前惰性初始化）
    private int expectedModCount;

    public ArrayListSpliterator<E> trySplit() {
        int hi = getFence(), lo = index, mid = (lo + hi) >>> 1;
        return (lo >= mid) ? null : new ArrayListSpliterator<>(list, lo, index = mid, expectedModCount);
    }

    public boolean tryAdvance(Consumer<? super E> action) {
        if (index < fence) {
            action.accept(list.elementData[index++]);
            return true;
        }
        return false;
    }

    public long estimateSize() { return (long)(getFence() - index); }

    public int characteristics() {
        return Spliterator.ORDERED | Spliterator.SIZED | Spliterator.SUBSIZED;
    }
}

分割时，index 和 fence 将原范围 [lo, hi) 分为 [lo, mid) 和 [mid, hi) 两部分，返回前一部分的新 Spliterator，原 Spliterator 收缩到后半部分。这种二分法非常高效，且由于 SUBSIZED 标志，分割后每个部分的精确大小仍是已知的，便于并行任务调度。

7.4 并行流任务提交预埋

当调用 parallelStream() 或 stream().parallel() 时，Stream 实例的 parallel 标志被设为 true。终止操作如 collect 会调用 evaluateParallel，内部使用 ForkJoinTask 将任务提交给 ForkJoinPool.commonPool() 执行。任务分解的关键代码如下（简化自 AbstractTask）：

java 复制代码

// AbstractTask.java
public void compute() {
    Spliterator<P_IN> rs = spliterator, ls;
    long sizeEstimate = rs.estimateSize();
    long sizeThreshold = getTargetSize(sizeEstimate);
    boolean forkRight = false;
    while (sizeEstimate > sizeThreshold && (ls = rs.trySplit()) != null) {
        AbstractTask<P_IN, P_OUT, ?> task = makeChild(ls);
        task.fork();          // 将左半任务提交到工作队列
        // 继续分割右半部分
    }
    // 当大小低于阈值，直接顺序处理
    doLeaf(rs);
}

工作线程在处理自己的任务时，还可能窃取其他线程任务队列中的 fork 任务（工作窃取算法），从而实现负载均衡。本文仅做预埋，详细并发机制将在系列后续篇章展开。

下面插入第六张图：Spliterator 分割与并行流任务分解图。

flowchart TD A[数据源 Spliterator estimateSize = N] --> B{大小 > 阈值?} B -- 是 --> C[调用 trySplit 分割为左右两部分] C --> D[左 Spliterator 约 N/2] C --> E[右 Spliterator 约 N/2] D --> F[封装为 ForkJoinTask fork 提交到工作队列] E --> B B -- 否 --> G[顺序执行 doLeaf 直接使用 Sink 链处理] F --> H[工作线程从队列窃取任务 执行 compute] H --> G style C fill:#fff3e0 style F fill:#ffcdd2 style G fill:#c8e6c9

a) 主旨概括 ：该图展示了并行流如何利用 trySplit 将数据源递归分割，并将子任务提交到 ForkJoinPool，最终每个小块顺序执行 Sink 流水线。

b) 逐元素分解：从原始 Spliterator 开始，只要估算大小超过设定的阈值，就不断二分切割，左侧部分 fork 为异步任务，右侧继续切割。当大小降至阈值以下时，当前线程直接对剩余 Spliterator 调用 Sink 链进行顺序处理。工作窃取使得空闲线程可以处理已 fork 的任务。

c) 设计原理映射：这种"分而治之"结合惰性求值流水线，使得 Stream 的并行化相对容易，且保持 API 的一致性。Spliterator 的特性标记帮助框架选择最优拆分策略。

d) 工程联系与关键结论 ：并非所有数据源都能高效分割（如 HashSet 的分割基于桶，可能不均匀），了解 characteristics 有助于判断并行化收益。对于 CPU 密集型操作且数据量巨大时，合理使用并行流可获得显著加速，但需注意线程安全和有状态操作的开销。

以下是重写后的面试高频专题部分，基于原文章进行了大幅扩展，每道题均给出深度解析、源码分析及面试追问预判，完全满足"详细说明"的要求。

面试高频专题

1. Stream 的惰性求值是什么意思？中间操作和终止操作在惰性求值中的角色分别是什么？

核心答案 ：

惰性求值是指中间操作（如 filter、map）在定义时不会立即执行遍历，仅构建流水线结构；只有遇到终止操作（如 collect、forEach）时，整个流水线才会被触发执行。中间操作的角色是"操作记录者 "------它们创建新的 AbstractPipeline 节点，并覆写 opWrapSink 方法以定义如何包装下游 Sink。终止操作的角色是"执行触发器 "------它调用 evaluate 或 wrapAndCopyInto，完成 Sink 链的构建、遍历数据源、驱动元素流经整个管道，并返回最终结果。

源码要点：

ReferencePipeline.filter() 返回一个新的 StatelessOp 对象，仅保存 Predicate，不遍历任何元素。
AbstractPipeline.evaluate(TerminalOp) 中首先检查 linkedOrConsumed 状态，然后根据串行/并行选择不同的执行路径，执行前会调用 sourceSpliterator() 获取源分割器。
在 evaluate 内部，terminalOp.evaluateSequential(this, sourceSpliterator) 会调用 wrapAndCopyInto，此时才真正构建 Sink 链并开始遍历。

面试追问：

为什么惰性求值能提升性能？
答：实现循环融合（loop fusion），只需一次遍历即可完成多个操作，避免产生中间集合。
如何验证惰性求值？
答：在 peek 或 filter 的 Lambda 中打印日志，观察只有终止操作调用后才输出。

2. Stream 的 Sink 接口有哪四个方法？它们的调用顺序是怎样的？在流水线中分别起什么作用？

核心答案 ：
Sink<T> 接口继承自 Consumer<T>，定义了四个方法：

begin(long size)：元素遍历开始前调用一次，传递数据源的元素数量（可能是估算值）。有状态操作用它分配资源（如 sorted 创建数组）。
accept(T t)：处理单个元素。由上游 Sink 或 Spliterator 调用，在 begin 之后被多次调用。
end()：所有元素处理完毕后调用一次。有状态操作在此执行最终化（如 sorted 排序后投递）。
cancellationRequested()：返回布尔值，表示是否请求取消。用于短路操作向上游传播停止信号。

调用顺序 （生命周期）：
begin(size) → 多次 accept(t) → end()，在 accept 循环中上游可能会轮询 cancellationRequested() 以提前终止。

源码体现：

java 复制代码

// AbstractPipeline.copyInto 简化逻辑
wrappedSink.begin(spliterator.getExactSizeIfKnown());
spliterator.forEachRemaining(wrappedSink); // 内部循环调用 wrappedSink.accept(t)
wrappedSink.end();

对于短路操作，forEachRemaining 内部可能检测 cancellationRequested()（或 Sink 自身在 accept 中丢弃元素）。
ChainedReference 将 begin、end、cancellationRequested 全部转发给下游，保证信号链式传播。

面试追问：

为什么 begin 要传递 size？
答：让有状态操作精确预分配资源，避免 ArrayList 扩容开销。
cancellationRequested 与线程中断有关系吗？
答：无关，它是 Stream 内部的协作式取消机制。

3. Stream 的中间操作是如何通过 `opWrapSink` 构建 Sink 责任链的？以 `filter` + `map` + `collect` 为例说明。

核心答案 ：
opWrapSink(int flags, Sink<E_OUT> downstream) 是每个中间操作必须实现的方法。flags 是上游传递下来的流标志组合，downstream 是下游 Sink（即元素经过当前操作后应传递到的下一个 Sink）。

构建过程 自下游向上游反向包装 。以 stream.filter(p).map(f).collect(toList()) 为例：

collect 创建终止 Sink（如 ReducingSink，内部持有 ArrayList）。
map 的 opWrapSink 被调用，传入 ReducingSink 作为 downstream，返回一个 Sink，其 accept 方法执行 downstream.accept(f.apply(e))。
filter 的 opWrapSink 被调用，传入 map 创建的 Sink，返回一个 Sink，其 accept 方法仅在 p.test(e) 为 true 时调用 downstream.accept(e)。

最终形成链：
filterSink -> mapSink -> reducingSink

源码关键 ：
AbstractPipeline.wrapSink(Sink<E_OUT> sink) 方法从当前阶段向上游递归，依次调用每个阶段的 opWrapSink，生成最终的 wrappedSink。filter 的 opWrapSink 通常会返回一个继承自 Sink.ChainedReference 的匿名类。

面试追问：

为什么包装顺序是从下游到上游？
答：因为最上游的 Sink 需要直接调用 Spliterator 投递的元素，所以必须持有下游的引用，自然是从终止 Sink 开始层层包裹。
flags 参数的作用？
答：携带 StreamOpFlag，例如 SIZED 表示上游元素数量已知，sorted 可据此优化数组初始容量。

4. 短路操作（如 `findFirst`、`limit`）是如何提前终止 Stream 遍历的？`cancellationRequested` 方法如何向上游传递停止信号？

核心答案 ：

短路操作的 Sink 内部维护一个状态标志，当满足终止条件时，其 cancellationRequested() 返回 true。

limit(n) ：内部计数器 remaining 从 n 减到 0 后，cancellationRequested() 返回 true，且 accept 停止向下游投递。
findFirst() ：一旦 accept 收到第一个元素，内部标记 hasValue = true，同时 cancellationRequested() 开始返回 true。

信号传播机制 ：

在 Sink.ChainedReference 中，cancellationRequested() 默认转发下游的结果：

java 复制代码

public boolean cancellationRequested() {
    return downstream.cancellationRequested();
}

因此，短路信号可以从终止 Sink 一路向上传播到最上游。在顺序流中，源 Spliterator 的 forEachRemaining 通常不会主动检测该信号（所以底层遍历可能仍会进行），但上游的无状态 Sink 在接收到元素后，若检测到下游 cancellationRequested() 为 true，可以直接丢弃元素不再调用 downstream.accept，从而避免下游计算。在并行流中，ForkJoinTask 的实现会利用 cancellationRequested() 来取消兄弟任务，真正做到提前终止遍历。

源码验证：

SliceOps.LimitSink 的 cancellationRequested() 返回 remaining == 0。
FindOps.FindSink 在 accept 中设置 hasValue = true，cancellationRequested() 返回 hasValue。

面试追问：

若 filter().findFirst() 在顺序流中，filter 的 Predicate 会被调用几次？
答：Spliterator 可能遍历全部元素，但 filter 的 Sink 在 findFirst 获得值后，其 cancellationRequested() 返回 true，filter 的 accept 可以选择跳过 Predicate 检测直接返回，从而节省开销（取决于实现，但 JDK 8 无此优化，通常还是会执行 Predicate 但不再向下游传递）。实际测试中 Predicate 仍会针对每个元素执行，因为 filter.accept 没有先检测 cancellationRequested。
如何真正减少源遍历？
答：使用能感知取消的 Spliterator，比如 IntStream.range 的 Spliterator 在 tryAdvance 中会检测 Sink 的 cancellationRequested。

5. 有状态操作（如 `sorted`、`distinct`）和无状态操作（如 `map`、`filter`）在 Sink 实现上有什么本质区别？

核心答案：

无状态操作 ：每个元素的处理 不依赖其他元素 。其 Sink 的 accept 方法直接处理元素并传递给下游，begin 和 end 通常空实现或直接转发。内存占用 O(1)。
有状态操作 ：需要 跨元素信息 才能完成计算，因此必须在 begin 中初始化状态存储，accept 中暂存元素，end 中执行最终计算并批量投递给下游。内存占用 O(n)。

典型实现对比：

操作	accept 行为	begin/end 行为
`filter` (无状态)	若满足条件则 `downstream.accept(t)`	转发
`sorted` (有状态)	将 `t` 添加到内部 `ArrayList`，不调用下游	`begin` 初始化数组；`end` 排序数组，然后遍历调用 `downstream.accept`
`distinct` (有状态)	若 `t` 不在 `HashSet` 中则加入并调用 `downstream.accept`	`begin` 初始化 `HashSet`；`end` 释放引用

源码示例 ：
SortedOps.SizedRefSortingSink 在 begin 中创建数组，accept 中填充，end 中 Arrays.sort 后遍历数组调用 downstream.accept。

面试追问：

为什么 sorted 后再 findFirst 会丧失短路优势？
答：sorted 的 end 需要所有元素缓存后才能排序，即使 findFirst 是短路操作，它也必须等待排序全部完成。
distinct 能处理无限流吗？
答：理论上不能，因为它需要将所有元素加入 HashSet，内存会无限增长。

6. Stream 为什么只能消费一次？如果重复消费会发生什么？这个限制是必要的吗？

核心答案 ：

Stream 实例内部维护一个 linkedOrConsumed 布尔标志（AbstractPipeline 中），初始为 false。当终止操作调用 evaluate 时，首先检查该标志，若为 true 则抛出 IllegalStateException("stream has already been operated upon or closed")，否则将其置为 true。
设计必要性：

多数数据源只能遍历一次（如 I/O 流、生成器函数），重复消费无法保证语义正确。
惰性求值不缓存元素，Stream 自身没有存储数据，重复消费意味着需要再次遍历源，但源可能已耗尽或状态已变。
避免资源泄漏 ：如 Files.lines() 返回的 Stream 关联着文件句柄，必须确保关闭一次。

源码：

java 复制代码

final <R> R evaluate(TerminalOp<E_OUT, R> terminalOp) {
    if (linkedOrConsumed)
        throw new IllegalStateException(MSG_STREAM_LINKED);
    linkedOrConsumed = true;
    // ...
}

面试追问：

如何"重用"一个数据流？
答：需要从原始数据源重新创建 Stream，如再次调用 list.stream()；或者使用 Supplier<Stream<T>> 工厂模式。
Stream 有没有 clone 方法？
答：没有，且不应设计，因为流是管道，不可复制。

7. `Spliterator` 和 `Iterator` 有什么区别？`trySplit` 方法在并行流中的作用是什么？

核心答案：

对比维度	Iterator	Spliterator
遍历方式	`hasNext()` + `next()` 外部迭代	`tryAdvance(Consumer)` 内部迭代
并行能力	不支持拆分	`trySplit()` 可分割为多个子迭代器
元信息	无	`characteristics()` 提供 SIZED、ORDERED 等标志
批量处理	无原生支持	`forEachRemaining(Consumer)` 批量处理

trySplit() 是并行流的核心。它将数据源划分成两部分，返回一个新的 Spliterator 覆盖前半部分，原 Spliterator 收缩到后半部分。ForkJoinTask 递归调用 trySplit 直到子任务大小小于阈值，然后并行执行。例如 ArrayListSpliterator 基于数组索引进行高效二分。

源码：

java 复制代码

public Spliterator<E> trySplit() {
    int lo = index, mid = (lo + fence) >>> 1;
    return (lo >= mid) ? null : new ArrayListSpliterator<>(list, lo, index = mid, expectedModCount);
}

面试追问：

所有 Spliterator 都能高效分割吗？
答：不是。HashSet 的 Spliterator 基于桶遍历，分割时可能不均匀，且分割成本较高。
characteristics 中 SUBSIZED 有何意义？
答：表示分割后的子 Spliterator 也精确知道大小，框架可据此精确控制任务粒度。

8. `parallelStream` 的底层线程池是什么？它是如何利用 `Spliterator.trySplit` 进行任务分解的？

核心答案 ：

并行流默认使用 ForkJoinPool.commonPool()，这是一个全局的、静态的 ForkJoinPool 实例，线程数为 Runtime.getRuntime().availableProcessors() - 1（可通过系统属性调整）。任务分解流程：

终止操作调用 evaluateParallel，创建一个根 ForkJoinTask（如 ForEachTask、ReduceTask）。
任务的 compute() 方法中，循环调用 spliterator.trySplit()，每次分割产生新的 Spliterator 并包装为子任务，通过 fork() 提交到工作队列。
当 estimateSize 低于阈值（如 N / (availableProcessors * 4)）时，停止分割，转为顺序执行 doLeaf()。
空闲线程通过 工作窃取（work-stealing） 从其他线程队列获取任务，实现负载均衡。

源码关键路径 ：
AbstractTask.compute() -> trySplit() + fork()，最终调用 task.doLeaf()，其中会使用 Sink 链顺序处理子 Spliterator。

面试追问：

能否自定义并行流使用的线程池？
答：并行流 API 未暴露设置方法，但可以通过 ForkJoinPool.submit(() -> stream.parallel().forEach(...)).get() 的方式在自定义池中运行。
commonPool 线程数量是否可调整？
答：可通过 JVM 参数 -Djava.util.concurrent.ForkJoinPool.common.parallelism=N 调整。

9. Stream 的 `forEach` 和 `forEachOrdered` 有什么区别？在并行流中各自的行为是什么？

核心答案：

forEach(Consumer)：不保证元素处理的顺序。在并行流中，各子任务独立处理自己的分段，输出顺序与源顺序无关，有利于最大化并行效率。
forEachOrdered(Consumer) ：保证元素按 遭遇顺序（encounter order）处理。在并行流中，即使使用多线程，最终执行 Consumer 的顺序也必须与顺序流一致，这需要额外的同步或缓冲，因此性能较低。

实现差异 ：
ForEachOps 中，forEach 在并行模式下直接对每个子 Spliterator 进行 forEachRemaining；而 forEachOrdered 则使用 ForEachOrderedTask，它在 compute() 中确保子任务按照分割的顺序依次执行，可能通过 CompletableFuture 或栅栏机制来编排。

面试追问：

如果数据源本身无序（如 HashSet），两者还有区别吗？
答：无区别，此时遭遇顺序未定义，Stream API 可能忽略排序保证以提升性能。
collect 是否受顺序影响？
答：Collector 如果是并发的（Characteristics.CONCURRENT），则无序；否则 collect 会使用组合器合并结果，也可能保持顺序。

10. （故障排查题）线上服务使用 `parallelStream` 处理大量数据时，发现某些请求延迟飙升至秒级，`jstack` 发现大量线程阻塞在 `ForkJoinPool` 的工作窃取上。经查代码中使用了 `sorted()` + `distinct()` 的有状态操作。请分析：(a) `sorted` 和 `distinct` 在并行流中为什么会导致性能退化？(b) `sorted` 在并行流中的实现和顺序流有什么不同？(c) 如何优化这个场景？

解析：

(a) 性能退化原因：

sorted 需要全量数据才能排序。在并行流中，各个子任务先对各自分段进行局部排序，然后通过归并（merge）生成全局有序结果。这涉及 大量的数组拷贝、归并比较及线程间的数据传递，并且最终的归并阶段通常由单线程完成，成为瓶颈。
distinct 在并行流中为保持线程安全，通常使用 ConcurrentHashMap 或类似的并发结构判重，导致 大量 CAS 竞争和潜在的哈希冲突。如果数据量大，锁竞争会导致 CPU 空转，且内存中同时存在多个分段判重集，增大 GC 压力。
当工作线程因等待锁或同步屏障而阻塞时，ForkJoinPool 会启动补偿线程，并触发频繁的工作窃取尝试，但若任务粒度不均，窃取可能失败，最终线程栈上出现大量阻塞在 ForkJoinPool 内部的调用。

(b) sorted 并行实现差异：

顺序流中，sorted 使用 SizedRefSortingSink，直接在单线程中缓存数组、排序、投递。
并行流中，SortedOps 使用 opEvaluateParallel，内部创建 ForkJoinTask 进行并行排序。典型流程：
1. 调用 Arrays.parallelSort（JDK 8+），它使用 ForkJoinPool 递归划分数组并排序。
2. 或者手动划分 Spliterator，每个子任务收集自己的元素到数组，排序后通过归并组合。
  这导致必须 额外复制元素到临时数组，进行多次归并，且任务依赖关系使得某些线程必须等待其他线程完成才能继续。

(c) 优化方案：

消除有状态操作 ：重新设计数据处理逻辑，例如先 distinct 再 sorted 可能改成直接使用 TreeSet 收集，一步完成排序去重。
采用串行流 ：如果数据量并非巨大（如几千以内），可取消 parallel()，用顺序流执行 sorted().distinct() 反而更快，因为避免了并行开销。
使用 Collectors.toCollection(TreeSet::new) ：直接在 collect 中收集到 TreeSet，利用其自然排序和唯一性，避免显式调用 sorted().distinct()。但注意这要求元素实现 Comparable 或提供 Comparator。
分批处理 + 合并：针对超大数据，可手动分段，每段独立排序去重后再归并，控制并行度。
调整 ForkJoinPool 并行度：若 CPU 核心数多，但任务因有状态操作严重串行化，可适当降低并行度，减少竞争。

面试追问：

如何诊断是 sorted 还是 distinct 导致的瓶颈？
答：分别注释掉其中一个操作，对比耗时；或使用 profiler 查看 CPU 热点是在排序归并还是 ConcurrentHashMap 的 CAS。
distinct 能否用布隆过滤器优化？
答：标准 Stream 不支持，但可自定义 Collector 使用布隆过滤器，但要忍受一定的误判率。

11. Stream 的 `flatMap` 和 `map` 有什么区别？`flatMap` 的 Sink 是如何实现"一对多"展开的？

核心答案：

map(Function<T, R>)：将 一个元素 T 转换为一个元素 R，一对一映射。
flatMap(Function<T, Stream<R>>)：将 一个元素 T 转换为一个 Stream<R>，然后将多个子流的元素"扁平化"合并到当前流中，实现一对多映射。

Sink 实现 ：
flatMap 的 Sink（ReferencePipeline.FlatMapSink）的核心逻辑：

java 复制代码

public void accept(T t) {
    try (Stream<? extends R> result = mapper.apply(t)) {
        if (result != null) {
            result.sequential().forEach(downstream); // 将子流的每个元素传给下游
        }
    }
}

它在 accept 中调用 mapper.apply(t) 得到一个子流，然后遍历子流，对每个元素调用 downstream.accept(e)。因此 一个输入元素可能在 flatMap 的 Sink 中产生多次 downstream.accept 调用 ，实现扁平化。注意内部子流也需要遵循惰性求值，只有 forEach 时才真正遍历子流元素。

面试追问：

如果子流也是惰性的，flatMap 如何处理无限流？
答：不能对无限流使用 flatMap 而不加限制，因为内层 forEach 会试图遍历子流的所有元素，可能导致无限循环。通常需要 limit 截断。
flatMap 和 mapMulti（Java 16+）有何不同？
答：mapMulti 使用命令式回调避免产生 Stream 对象，减少 GC 压力。

12. Stream 的 `close` 机制是什么？`BaseStream.onClose` 方法的作用是什么？Stream 在什么情况下需要显式关闭？

核心答案 ：
BaseStream 接口定义了 close() 方法和 onClose(Runnable closeHandler)。只有某些 Stream 实现需要关闭 ，主要是那些持有底层 I/O 资源的流，例如 Files.lines()、Files.list()、BufferedReader.lines() 等。

调用 close() 会依次执行通过 onClose 注册的关闭处理器（Runnable），并释放底层资源（如关闭文件句柄）。这些处理器按照添加顺序逆序执行（类似栈），若某个处理器抛出异常，后续处理器仍会执行，最终抛出一个组合异常。

源码：
AbstractPipeline 中维护一个 Runnable 链表（closeHandlers），close() 方法会遍历并执行它们，同时设置 linkedOrConsumed = true 防止再次操作。

何时需显式关闭 ：

当使用 I/O 相关的流时，强烈推荐使用 try-with-resources：

java 复制代码

try (Stream<String> lines = Files.lines(Paths.get("file.txt"))) {
    lines.filter(...).forEach(...);
}

如果不关闭，文件句柄可能不被及时释放，导致资源泄漏。对于集合或数组生成的 Stream，close() 是无操作，不需要调用。

面试追问：

onClose 注册的处理器在并行流中由哪个线程执行？
答：由调用 close() 的线程执行，与流操作执行线程无关。
如果流已执行终止操作，还需要手动关闭吗？
答：I/O 流在终止操作完成后不会自动关闭，必须显式调用 close() 或使用 try-with-resources。

以上即为面试高频专题的详细解析，覆盖了 Stream 惰性求值、Sink 责任链、短路机制、有状态操作、并行流原理及故障排查等核心考察点，每道题均可作为面试场景的深度追问基础。

Demo 代码

1. 惰性求值验证

java 复制代码

import java.util.Arrays;
import java.util.List;
import java.util.stream.Collectors;
import java.util.stream.Stream;

public class LazyDemo {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("Apple", "Banana", "Cherry", "Date");
        System.out.println("=== 构建流，添加中间操作 ===");
        Stream<String> stream = list.stream()
                .peek(x -> System.out.println("  peek in source: " + x))
                .filter(x -> {
                    System.out.println("  filter: " + x);
                    return x.startsWith("A") || x.startsWith("C");
                })
                .map(x -> {
                    System.out.println("  map: " + x);
                    return x.toUpperCase();
                });
        System.out.println("流已构建，但无任何输出，说明中间操作尚未执行。");
        System.out.println("=== 触发终止操作 ===");
        List<String> result = stream.collect(Collectors.toList());
        System.out.println("结果: " + result);
        // 注意：再次消费会抛出 IllegalStateException
        // stream.collect(Collectors.toList());
    }
}

解读：peek、filter、map 的 Lambda 在 collect 调用前不会执行，验证了惰性求值特性。

2. 短路操作验证

java 复制代码

import java.util.stream.IntStream;

public class ShortCircuitDemo {
    public static void main(String[] args) {
        int[] count = {0};
        IntStream.range(1, 100)
                .filter(x -> {
                    count[0]++;
                    System.out.println("filter: " + x);
                    return x % 2 == 0;  // 偶数
                })
                .map(x -> {
                    System.out.println("map: " + x);
                    return x * x;
                })
                .findFirst()  // 找到第一个元素
                .ifPresent(val -> System.out.println("Found: " + val));
        System.out.println("filter 被调用次数: " + count[0]);
    }
}

观察：由于 findFirst 是短路操作，尽管数据源有 99 个元素，但 filter 仅被调用了 2 次（1 和 2），因为元素 2 是第一个偶数，满足后 findFirst 立即终止传递，但注意源 Spliterator 可能仍然遍历了全部元素（视具体实现），然而下游的 map 和终止操作已不再执行。

3. Sink 生命周期观察（自定义 Collector）

java 复制代码

import java.util.*;
import java.util.function.BiConsumer;
import java.util.function.BinaryOperator;
import java.util.function.Function;
import java.util.function.Supplier;
import java.util.stream.Collector;

public class SinkLifeDemo {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("x", "y", "z");
        list.stream()
            .filter(s -> true)
            .collect(new Collector<String, List<String>, List<String>>() {
                @Override public Supplier<List<String>> supplier() {
                    System.out.println("supplier: 创建容器");
                    return ArrayList::new;
                }
                @Override public BiConsumer<List<String>, String> accumulator() {
                    return (l, s) -> {
                        System.out.println("accumulator: accept " + s);
                        l.add(s);
                    };
                }
                @Override public BinaryOperator<List<String>> combiner() { return (l1, l2) -> { l1.addAll(l2); return l1; }; }
                @Override public Function<List<String>, List<String>> finisher() {
                    return l -> {
                        System.out.println("finisher: 完成收集，结果大小为 " + l.size());
                        return l;
                    };
                }
                @Override public Set<Characteristics> characteristics() { return Collections.emptySet(); }
            });
    }
}

解读：输出顺序展示了终止 Sink 的 begin（通过 supplier）、accept（accumulator）、end（finisher）的生命周期。

4. Spliterator 分割演示

java 复制代码

import java.util.ArrayList;
import java.util.Spliterator;

public class SpliteratorDemo {
    public static void main(String[] args) {
        ArrayList<Integer> list = new ArrayList<>();
        for (int i = 0; i < 10; i++) list.add(i);
        Spliterator<Integer> s1 = list.spliterator();
        System.out.println("原始 size: " + s1.estimateSize());
        Spliterator<Integer> s2 = s1.trySplit();
        System.out.println("s1 size: " + s1.estimateSize() + " s2 size: " + s2.estimateSize());
        System.out.print("s2 元素: ");
        s2.forEachRemaining(e -> System.out.print(e + " "));
        System.out.print("\ns1 元素: ");
        s1.forEachRemaining(e -> System.out.print(e + " "));
    }
}

解读：trySplit 将原始 10 个元素分成约两个各 5 的部分，体现了 Spliterator 的二分切割特性。

附录：Stream 核心机制速查表

分类	内容
三大特性	① 不存数据：对数据源的视图；② 不修改源：返回新 Stream；③ 惰性求值：中间操作仅构建蓝图，终止操作触发执行
操作分类	中间操作：`filter`、`map`、`flatMap`、`peek`、`distinct`、`sorted`、`limit`、`skip`（惰性，返回 Stream）终止操作：`collect`、`forEach`、`reduce`、`count`、`min`、`max`、`anyMatch`、`allMatch`、`noneMatch`、`findFirst`、`findAny`（触发执行，返回结果）
Sink 方法	`begin(long size)` 初始化；`accept(T t)` 处理单元素；`end()` 结束化；`cancellationRequested()` 短路请求
短路操作	`limit(n)`、`findFirst()`、`findAny()`、`anyMatch`（遇到不满足立即终止）；通过 `cancellationRequested` 传递停止信号
有状态操作	`sorted` 缓存全部元素排序，内存 O(n)；`distinct` HashSet 判重，内存 O(n)；会破坏短路特性，慎与无限流连用
Spliterator	可分割的迭代器；`trySplit` 二分切割；`tryAdvance` 顺序处理；`characteristics` 提供优化标志；为并行流提供任务分解基础

结语：Stream 的惰性求值不是简单的延迟执行，它是一整套基于 Sink 责任链、生命周期协议和 Spliterator 分割遍历的流水线架构。只有理解元素如何从源 Spliterator 穿过层层 Sink，最终落入终止操作的收集器，才能真正掌握 Stream 的性能特性，写出既优雅又高效的代码。下一篇我们将进入 Collectors 的深邃世界，揭秘书写自定义收集器的艺术。

Stream API 惰性求值与内部迭代

概述

开篇衔接

1. Stream 三大特性：不存数据、不修改源、惰性求值、可消费一次

1.1 不存数据：Stream 是视图，而非容器

1.2 不修改源：函数式不可变性

1.3 惰性求值：中间操作仅构建蓝图

1.4 可消费一次：Stream 关闭与重用检测

1.5 内部迭代 vs 外部迭代

2. 中间操作与终止操作：分类、无状态 vs 有状态、惰性 vs 触发

2.1 中间操作

2.2 终止操作

2.3 无状态操作 vs 有状态操作

3. Sink 责任链构建：opWrapSink 层层包装，形成处理管道

3.1 Sink 接口：四方法生命周期

3.2 opWrapSink 与 Sink 链的构建

3.3 ChainedReference 等内部类

4. 终止操作触发执行：wrapAndCopyInto 的 begin → accept → end 流程

4.1 触发入口：evaluate 与 wrapAndCopyInto

4.2 生命周期详解：begin(size) → accept(t) × N → end()

4.2.1 begin(size)

4.2.2 accept(t) --- 逐元素处理

4.2.3 end() --- 结束与清理

4.2.4 获取结果

5. 短路操作：cancellationRequested 向上游传递停止信号

5.1 短路操作的类型与意义

5.2 cancellationRequested 机制

5.3 短路信号在 Sink 链中的传播

6. 有状态操作实现：sorted（全量缓存）与 distinct（HashSet 去重）

6.1 sorted 的完整实现剖析

6.2 distinct 的 HashSet 判重

6.3 有状态操作对并行流的限制

7. Spliterator：trySplit 分割遍历与 parallelStream 并行预埋

7.1 Spliterator 接口概览

7.2 Spliterator vs Iterator

7.3 ArrayListSpliterator 分割实例

7.4 并行流任务提交预埋

面试高频专题

1. Stream 的惰性求值是什么意思？中间操作和终止操作在惰性求值中的角色分别是什么？

2. Stream 的 Sink 接口有哪四个方法？它们的调用顺序是怎样的？在流水线中分别起什么作用？

3. Stream 的中间操作是如何通过 opWrapSink 构建 Sink 责任链的？以 filter + map + collect 为例说明。

4. 短路操作（如 findFirst、limit）是如何提前终止 Stream 遍历的？cancellationRequested 方法如何向上游传递停止信号？

5. 有状态操作（如 sorted、distinct）和无状态操作（如 map、filter）在 Sink 实现上有什么本质区别？

6. Stream 为什么只能消费一次？如果重复消费会发生什么？这个限制是必要的吗？

7. Spliterator 和 Iterator 有什么区别？trySplit 方法在并行流中的作用是什么？

8. parallelStream 的底层线程池是什么？它是如何利用 Spliterator.trySplit 进行任务分解的？

9. Stream 的 forEach 和 forEachOrdered 有什么区别？在并行流中各自的行为是什么？

11. Stream 的 flatMap 和 map 有什么区别？flatMap 的 Sink 是如何实现"一对多"展开的？

12. Stream 的 close 机制是什么？BaseStream.onClose 方法的作用是什么？Stream 在什么情况下需要显式关闭？

Demo 代码

1. 惰性求值验证

2. 短路操作验证

3. Sink 生命周期观察（自定义 Collector）

4. Spliterator 分割演示

延伸阅读

附录：Stream 核心机制速查表

3. Stream 的中间操作是如何通过 `opWrapSink` 构建 Sink 责任链的？以 `filter` + `map` + `collect` 为例说明。

4. 短路操作（如 `findFirst`、`limit`）是如何提前终止 Stream 遍历的？`cancellationRequested` 方法如何向上游传递停止信号？

5. 有状态操作（如 `sorted`、`distinct`）和无状态操作（如 `map`、`filter`）在 Sink 实现上有什么本质区别？

7. `Spliterator` 和 `Iterator` 有什么区别？`trySplit` 方法在并行流中的作用是什么？

8. `parallelStream` 的底层线程池是什么？它是如何利用 `Spliterator.trySplit` 进行任务分解的？

9. Stream 的 `forEach` 和 `forEachOrdered` 有什么区别？在并行流中各自的行为是什么？

11. Stream 的 `flatMap` 和 `map` 有什么区别？`flatMap` 的 Sink 是如何实现"一对多"展开的？

12. Stream 的 `close` 机制是什么？`BaseStream.onClose` 方法的作用是什么？Stream 在什么情况下需要显式关闭？