Java 8 中的 Stream API,用于处理集合数据

Java 8 引入了 Stream API,使得处理集合数据变得更加简洁和高效。Stream API 允许开发者以声明式编程风格操作数据集合,而不是使用传统的迭代和条件语句。

一、基本概念

1.1 什么是 Stream

Stream 是 Java 8 中的一个新抽象,它允许对集合数据执行各种复杂的操作,例如过滤、映射、规约、收集等。Stream 不存储数据,而是从集合或其他数据源(如数组、I/O channel 等)中获取数据并进行操作。

Stream 的主要特点包括:

  • 无存储:Stream 不存储数据,只是对数据进行操作。
  • 函数式编程:使用 lambda 表达式进行操作,使代码更简洁。
  • 延迟执行:Stream 操作是懒加载的,只有在需要结果时才会执行。
  • 可组合性:多个 Stream 操作可以连成一串操作链,形成一系列的转换。

1.2 Stream 的生命周期

Stream 的操作可以分为三类:

  • :创建 Stream 的数据源,例如集合、数组或 I/O channel。
  • 中间操作:返回新的 Stream 的操作,例如过滤、映射。
  • 终端操作:产生结果或副作用的操作,例如收集、计算。

一个 Stream 的生命周期可以简单描述为:

  1. 创建 Stream。
  2. 中间操作。
  3. 终端操作。

二、Stream API 的基本操作

2.1 创建 Stream

Stream 可以通过以下几种方式创建:

  • 从集合
java 复制代码
List<String> list = Arrays.asList("a", "b", "c");
Stream<String> stream = list.stream();
  • 从数组
java 复制代码
String[] array = {"a", "b", "c"};
Stream<String> stream = Arrays.stream(array);
  • 从值
java 复制代码
Stream<String> stream = Stream.of("a", "b", "c");
  • 从文件
java 复制代码
Stream<String> stream = Files.lines(Paths.get("path/to/file.txt"));

2.2 中间操作

中间操作返回一个新的 Stream,它们是延迟执行的,只有在终端操作执行时才会实际进行计算。常用的中间操作包括:

2.2.1 filter

filter 用于对 Stream 中的元素进行过滤,只保留满足条件的元素。

java 复制代码
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
Stream<Integer> evenNumbers = numbers.stream().filter(n -> n % 2 == 0);
2.2.2 map

map 用于将 Stream 中的每个元素映射到另一个元素。

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
Stream<Integer> wordLengths = words.stream().map(String::length);
2.2.3 flatMap

flatMap 用于将 Stream 中的每个元素映射到一个新的 Stream,并将这些新 Stream 合并成一个 Stream。

java 复制代码
List<List<String>> listOfLists = Arrays.asList(Arrays.asList("a", "b"), Arrays.asList("c", "d"));
Stream<String> flatStream = listOfLists.stream().flatMap(Collection::stream);
2.2.4 distinct

distinct 用于去除 Stream 中的重复元素。

java 复制代码
List<Integer> numbers = Arrays.asList(1, 2, 2, 3, 4, 4, 5);
Stream<Integer> distinctNumbers = numbers.stream().distinct();
2.2.5 sorted

sorted 用于对 Stream 中的元素进行排序,可以传递一个比较器。

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
Stream<String> sortedWords = words.stream().sorted();

2.3 终端操作

终端操作会触发 Stream 的计算,并生成结果或副作用。常用的终端操作包括:

2.3.1 forEach

forEach 用于对 Stream 中的每个元素执行一个动作。

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
words.stream().forEach(System.out::println);
2.3.2 toArray

toArray 用于将 Stream 中的元素收集到一个数组中。

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
String[] array = words.stream().toArray(String[]::new);
2.3.3 reduce

reduce 用于将 Stream 中的元素通过一个关联函数组合起来,生成一个值。

java 复制代码
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
int sum = numbers.stream().reduce(0, Integer::sum);
2.3.4 collect

collect 用于将 Stream 中的元素收集到一个容器中,例如 List、Set 或 Map。

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
List<String> upperCaseWords = words.stream().map(String::toUpperCase).collect(Collectors.toList());
2.3.5 count

count 用于返回 Stream 中的元素数量。

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
long count = words.stream().count();
2.3.6 findFirstfindAny

findFirst 用于返回 Stream 中的第一个元素(如果存在)。

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
Optional<String> first = words.stream().findFirst();

findAny 用于返回 Stream 中的任意一个元素(如果存在),常用于并行流。

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
Optional<String> any = words.stream().findAny();
2.3.7 anyMatchallMatchnoneMatch

这三个操作用于检查 Stream 中是否有任意、所有或没有元素满足指定的条件。

java 复制代码
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
boolean anyEven = numbers.stream().anyMatch(n -> n % 2 == 0);
boolean allEven = numbers.stream().allMatch(n -> n % 2 == 0);
boolean noneNegative = numbers.stream().noneMatch(n -> n < 0);

三、并行流

Java 8 提供了并行流,可以充分利用多核处理器的优势。只需调用 parallelStream 方法即可创建一个并行流。

java 复制代码
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
int sum = numbers.parallelStream().reduce(0, Integer::sum);

并行流通过将数据分成多个子流,并在不同的 CPU 核心上并行处理这些子流,然后再合并结果,来提高处理速度。需要注意的是,并行流适合于无状态和无副作用的操作,使用时需小心处理共享变量和同步问题。

四、Stream API 的最佳实践

4.1 使用 Lambda 表达式

Stream API 通常与 lambda 表达式一起使用,使代码更加简洁和易读。例如:

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
List<String> upperCaseWords = words.stream().map(word -> word.toUpperCase()).collect(Collectors.toList());

4.2 避免使用修改状态的中间操作

Stream 操作应该是无副作用的,即不应修改外部状态。以下示例展示了一个错误的用法:

java 复制代码
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
List<Integer> results = new ArrayList<>();
numbers.stream().forEach(n -> results.add(n * 2));  // 这样做是错误的

正确的做法是使用终端操作 collect

java 复制代码
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
List<Integer> results = numbers.stream().map(n -> n * 2).collect(Collectors.toList());

4.3 利用方法引用

方法引用可以使代码更加简洁。例如,使用方法引用替代 lambda 表达式:

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
List<String> upperCaseWords = words.stream().map(String::toUpperCase).collect(Collectors.toList());

4.4 避免使用并行流进行小任务

并行流在处理大量数据或复杂计算时非常高效,但对于小任务,启动并行计算的开销可能会大于收益。因此,在数据量较小或计算较简单的情况下,优先使用顺序流。

4.5 避免在终端操作之前调用 findAny

在终端操作之前调用 findAny 会导致流的中间操作链被截断,进而无法正确执行后续的操作。例如:

java 复制代码
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
Optional<Integer> result = numbers.stream().filter(n -> n % 2 == 0).findAny(); // 这样做会中断流

应将 findAny 用作终端操作:

java 复制代码
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
Optional<Integer> result = numbers.stream().filter(n -> n % 2 == 0).findAny();

4.6 使用 collect 进行结果收集

collect 是一个强大的终端操作,可以将流中的元素收集到各种容器中。例如,收集到 List:

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
List<String> wordList = words.stream().collect(Collectors.toList());

4.7 使用 Collectors 进行复杂收集操作

Collectors 提供了多种收集器,可以进行复杂的结果收集。例如,收集到 Map:

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
Map<Integer, List<String>> wordLengthMap = words.stream().collect(Collectors.groupingBy(String::length));

4.8 使用 Optional 处理可能的空值

Stream API 中的某些终端操作会返回 Optional,例如 findFirstfindAny。使用 Optional 可以避免空指针异常:

java 复制代码
List<String> words = Arrays.asList("Java", "Stream", "API");
Optional<String> firstWord = words.stream().findFirst();
firstWord.ifPresent(System.out::println);

Java 8 的 Stream API 为集合数据的处理提供了一种高效、简洁的方式。通过理解和掌握 Stream 的基本概念、常用操作以及最佳实践,可以大大提高 Java 开发的生产力和代码质量。

Stream API 不仅支持顺序流,还支持并行流,使得在多核环境下处理大量数据变得更加高效。在实际开发中,合理使用 Stream API 可以显著提升代码的可读性和稳定性。

黑马程序员免费预约咨询

相关推荐
Kai HVZ17 分钟前
python爬虫----爬取视频实战
爬虫·python·音视频
古希腊掌管学习的神19 分钟前
[LeetCode-Python版]相向双指针——611. 有效三角形的个数
开发语言·python·leetcode
赵钰老师20 分钟前
【R语言遥感技术】“R+遥感”的水环境综合评价方法
开发语言·数据分析·r语言
m0_7482448322 分钟前
StarRocks 排查单副本表
大数据·数据库·python
V+zmm1013425 分钟前
基于微信小程序的乡村政务服务系统springboot+论文源码调试讲解
java·微信小程序·小程序·毕业设计·ssm
就爱学编程28 分钟前
重生之我在异世界学编程之C语言小项目:通讯录
c语言·开发语言·数据结构·算法
B站计算机毕业设计超人28 分钟前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
路人甲ing..31 分钟前
jupyter切换内核方法配置问题总结
chrome·python·jupyter
游客52043 分钟前
opencv中的常用的100个API
图像处理·人工智能·python·opencv·计算机视觉
Oneforlove_twoforjob1 小时前
【Java基础面试题025】什么是Java的Integer缓存池?
java·开发语言·缓存