1.Lambda
1.1 格式
JDK 从 1.8 版本开始支持 Lambda 表达式,通过 Lambda 表达式我们可以将一个函数作为参数传入方法中。在 JDK 1.8 之前,我们只能通过匿名表达式来完成类似的功能,但是匿名表达式比较繁琐,存在大量的模板代码,不利于将行为参数化,而采用 Lamdba 则能很好的解决这个问题。Lambda 表达式的基本语法如下:
(parameters) -> expression
或采用花括号的形式:
(parameters)` `->` `{` `statements;` `}
Lambda 表达式具有如下特点:
可选的参数:不需要声明参数类型,编译器会依靠上下文进行自动推断;
可选的参数圆括号:当且仅当只有一个参数时,包裹参数的圆括号可以省略;
可选的花括号:如果主体只有一个表达式,则无需使用花括号;
可选的返回关键字:如果主体只有一个表达式,则该表达式的值就是整个 Lambda 表达式的返回值,此时不需要使用 return 关键字进行显式的返回。
1.2 行为参数化
上面我们说过,Lambda 表达式主要解决的是行为参数化的问题,而什么是行为参数化?下面给出一个具体的示例:
/**`
`* 定义函数式接口`
`*` `@param` `<T> 参数类型`
`*/`
`@FunctionalInterface`
`public` `interface` `CustomPredicate<T>` `{`
`boolean` `test(T` `t);`
`}`
`/**`
`* 集合过滤`
`*` `@param` `list 待过滤的集合`
`*` `@param` `predicate 函数式接口`
`*` `@param` `<T> 集合中元素的类型`
`*` `@return 满足条件的元素的集合`
`*/`
`public` `static` `<T>` `List<T>` `filter(List<T>` `list,` `CustomPredicate<T>` `predicate)` `{`
`ArrayList<T>` `result` `=` `new` `ArrayList<>();`
`for` `(T` `t` `:` `list)` `{`
`// 将满足条件的元素添加到返回集合中`
`if` `(predicate.test(t))` `result.add(t);`
`}`
`return` `result;`
`}
针对不同类型的集合,我们可以通过传入不同的 Lambda 表达式作为参数来表达不同的过滤行为,这就是行为参数化:
List<Integer>` `integers` `=` `Arrays.asList(1,` `2,` `3,` `4,` `5);`
`filter(integers,` `x` `->` `x` `%` `2` `==` `0);` `// 过滤出所有偶数`
`List<Employee>` `employees` `=` `Arrays.asList(`
`new` `Employee("张某",` `21,` `true),`
`new` `Employee("李某",` `30,` `true),`
`new` `Employee("王某",` `45,` `false));`
`filter(employees,` `employee` `->` `employee.getAge()` `>` `25);` `// 过滤出所有年龄大于25的员工
需要注意的是上面我们声明接口时,使用了 @FunctionalInterface 注解,它表示当前的接口是一个函数式接口。函数式接口就是只含有一个抽象方法的接口;即一个接口不论含有多少个默认方法和静态方法,只要它只有一个抽象方法,它就是一个函数式接口。使用 @FunctionalInterface 修饰后,当该接口有一个以上的抽象方法时,编译器就会进行提醒。
任何使用到函数式接口的地方,都可以使用 Lambda 表达式进行简写。例如 Runnable 接口就是一个函数式接口,我们可以使用 Lambda 表达式对其进行简写:
new` `Thread(()` `->` `{`
`System.out.println("hello");`
`});`
`
1.3 方法引用和构造器引用
紧接上面的例子,如果我们需要过滤出所有的正式员工,除了可以写成下面的形式外:
filter(employees,` `employee` `->` `employee.isOfficial());
还可以使用方法引用的形式进行简写:
filter(employees,` `Employee::isOfficial);
除了方法引用外,还可以对构造器进行引用,示例如下:
Stream<Integer>` `stream` `=` `Stream.of(1,` `3,` `5,` `2,` `4);`
`stream.collect(Collectors.toCollection(ArrayList::new));` `//等价于 toCollection(()->new` `ArrayList<>())
方法引用和构造器引用的目的都是为了让代码更加的简洁。
2. 函数式接口
通常我们不需要自定义函数式接口,JDK 中内置了大量函数式接口,基本可以满足大多数场景下的使用需求,最基本的四种如下:
2.1. Consumer<T>消费型接口
消费输入的变量,没有返回值:
@FunctionalInterface`
`public` `interface` `Consumer<T>` `{`
`void` `accept(T` `t);`
`...`
`}
2. 2 Consumer<T>:供给型接口
供给变量:
@FunctionalInterface`
`public` `interface` `Supplier<T>` `{`
`T` `get();`
`}
2.3 Function<T, R>:
对输入类型为 T 的变量执行特定的转换操作,并返回类型为 R 的返回值:
@FunctionalInterface`
`public` `interface` `Function<T,` `R>` `{`
`R` `apply(T` `t);`
`...`
`}
2.4 Predicate<T>:
判断类型为 T 的变量是否满足特定的条件,如果满足则返回 true,否则返回 false:
@FunctionalInterface`
`public` `interface` `Predicate<T>` `{`
`boolean` `test(T` `t);`
`...`
`}
其他函数式接口都是这四种基本类型的扩展和延伸。以 BiFunction 和 BinaryOperator 接口为例:
BiFunction<T, U, R>:是函数型接口 Function<T, R> 的扩展,Function 只能接收一个入参;而 BiFunction 可以用于接收两个不同类型的入参;
BinaryOperator<T>:是 BiFunction 的一种特殊化情况,即两个入参和返回值的类型均相同,通常用于二元运算。定义如下:
@FunctionalInterface`
`public` `interface` `BiFunction<T,` `U,` `R>` `{`
`R` `apply(T` `t,` `U` `u);`
`}`
`@FunctionalInterface`
`public` `interface` `BinaryOperator<T>` `extends` `BiFunction<T,T,T>` `{`
`....`
`}
下面演示一下 BinaryOperator 的用法:
/`
`* 执行归约操作`
`*/`
`public` `static` `<T>` `T` `reduce(List<T>` `list,` `T` `initValue,` `BinaryOperator<T>` `binaryOperator)` `{`
`for` `(T` `t` `:` `list)` `{`
`initValue` `=` `binaryOperator.apply(initValue,` `t);`
`}`
`return` `initValue;`
`}`
`public` `static` `void` `main(String[]` `args)` `{`
`List<Integer>` `integers` `=` `Arrays.asList(1,` `2,` `3,` `4,` `5);`
`reduce(integers,` `0,` `(a,` `b)` `->` `a` `+` `b);` `// 求和 输出:15`
`reduce(integers,` `1,` `(a,` `b)` `->` `a` `*` `b);` `// 求积 输出:120`
`}
3. 创建流
JDK 1.8 中另一个大的改进是引入了流,通过流、Lamda 表达式以及函数式接口,可以高效地完成数据的处理。创建流通常有以下四种方法:
3.1 由值创建
使用静态方法 Stream.of() 由指定的值进行创建:
Stream<String>` `stream` `=` `Stream.of("a",` `"b",` `"c",` `"d");
3.2 由集合或数组创建
使用静态方法 Arrays.stream() 由指定的数组进行创建:
String[]` `strings={"a",` `"b",` `"c",` `"d"};`
`Stream<String>` `stream` `=` `Arrays.stream(strings);
调用集合类的 stream() 方法进行创建:
List<String>` `strings` `=` `Arrays.asList("a",` `"b",` `"c",` `"d");`
`Stream<String>` `stream` `=` `strings.stream();
stream() 方法定义在 Collection 接口中,它是一个默认方法,因此大多数的集合都可以通过该方法来创建流:
public` `interface` `Collection<E>` `extends` `Iterable<E>` `{`
`default` `Stream<E>` `stream()` `{`
`return` `StreamSupport.stream(spliterator(),` `false);`
`}`
`}`
`
3.3 由文件创建
try` `(Stream<String>` `lines` `=` `Files.lines(Paths.get("pom.xml"),` `StandardCharsets.UTF_8))` `{`
`lines.forEach(System.out::println);`
`}` `catch` `(IOException` `e)` `{`
`e.printStackTrace();`
`}
3.4 由函数创建
除了以上方法外,还可以通过 Stream.iterate() 和 Stream.generate() 方法来来创建无限流:
Stream.iterate() 接受两个参数:第一个是初始值;第二个参数是一个输入值和输出值相同的函数型接口,主要用于迭代式地产生新的元素,示例如下:
// 依次输出0到9`
`Stream.iterate(0,` `x` `->` `x` `+` `1).limit(10).forEach(System.out::print);`
`Stream.generate() 接收一个供应型函数作为参数,用于按照该函数产生新的元素:`
`// 依次输出随机数`
`Stream.generate(Math::random).limit(10).forEach(System.out::print);`
`
4. 操作流
4.1 基本操作
当流创建后,便可以利用 Stream 类上的各种方法对流中的数据进行处理,常用的方法如下:
|-----------|-------------------|---------------|---------------------------|
| 操作 | 作用 | 返回类型 | 使用的类型/函数式接口 |
| filter | 过滤符合条件的元素 | Stream<T> | Predicate<T> |
| distinct | 过滤重复元素 | Stream<T> | |
| skip | 跳过指定数量的元素 | Stream<T> | long |
| limit | 限制元素的数量 | Stream<T> | long |
| map | 对元素执行特定转换操作 | Stream<T> | Function<T,R> |
| flatMap | 将元素扁平化后执行特定转换操作 | Stream<T> | Function<T,Stream<R>> |
| sorted | 对元素进行排序 | Stream<T> | Comparator<T> |
| anyMatch | 是否存在任意一个元素能满足指定条件 | boolean | Predicate<T> |
| noneMatch | 是否所有元素都不满足指定条件 | boolean | Predicate<T> |
| allMatch | 是否所有元素都满足指定条件 | boolean | Predicate<T> |
| findAny | 返回任意一个满足指定条件的元素 | Optional<T> | |
| findFirst | 返回第一个满足指定条件的元素 | Optional<T> | |
| forEach | 对所有元素执行特定的操作 | void | Cosumer<T> |
| collect | 使用收集器 | R | Collector<T, A, R> |
| reduce | 执行归约操作 | Optional<T> | BinaryOperator<T> |
| count | 计算流中元素的数量 | long | |
注:上表中返回类型为 Stream<T> 的操作都是中间操作,代表还可以继续调用其它方法对流进行处理。返回类型为其它的操作都是终止操作,代表处理过程到此为止。
使用示例如下:
Stream.iterate(0,` `x` `->` `x` `+` `1)` `// 构建流`
`.limit(20)` `// 限制元素的个数`
`.skip(10)` `// 跳过前10个元素`
`.filter(x` `->` `x` `%` `2` `==` `0)` `// 过滤出所有偶数`
`.map(x` `->` `"偶数:"` `+` `x)` `// 对元素执行转换操作`
`.forEach(System.out::println);` `// 打印出所有元素`
`输出结果如下:`
`shell`
`偶数:10`
`偶数:12`
`偶数:14`
`偶数:16`
`偶数:18`
`
上表的 flatMap() 方法接收一个参数,该参数是一个函数型接口 Function<? super T, ? extends Stream<? extends R>> mapper,主要用于将流中的元素转换为 Stream ,从而可以将原有的元素进行扁平化,示例如下:
String[]` `strings` `=` `{"hello",` `"world"};`
`Arrays.stream(strings)`
`.map(x` `->` `x.split(""))` `// 拆分得到:` `['h','e','l','l','o'],['w','o','r','l','d']`
`.flatMap(x` `->` `Arrays.stream(x))` `// 将每个数组进行扁平化处理得到:'h','e','l','l','o','w','o','r','l','d'`
`.forEach(System.out::println);
而上表的 reduce() 方法则接收两个参数:第一个参数表示执行归约操作的初始值;第二个参数是上文我们介绍过的函数式接口 BinaryOperator<T> ,使用示例如下:
Stream.iterate(0,` `x` `->` `x` `+` `1).limit(10)`
`.reduce(0,` `(a,` `b)` `->` `a` `+` `b);` `//进行求和操作`
`
4.2 数值流
上面的代码等效于对 Stream 中的所有元素执行了求和操作,因此我们还可以调用简便方法 sum() 来进行实现,但是需要注意的是 Stream.iterate() 生成流中的元素类型都是包装类型:
Stream<Integer>` `stream` `=` `Stream.iterate(0,` `x` `->` `x` `+` `1);` `//包装类型Integer`
`而 sum() 方法则是定义在 IntStream 上,此时需要将流转换为具体的数值流,对应的方法是 mapToInt():`
`Stream.iterate(0,` `x` `->` `x` `+` `1).limit(10).mapToInt(x` `->` `x).sum();
类似的方法还有 mapToLong() 和 mapToDouble() 。如果你想要将数值流转换为原有的流,相当于对其中的元素进行装箱操作,此时可以调用 boxed() 方法:
IntStream` `intStream` `=` `Stream.iterate(0,` `x` `->` `x` `+` `1).limit(10).mapToInt(x` `->` `x);`
`Stream<Integer>` `boxed` `=` `intStream.boxed();`
`
5. 流 收集器
5.1 常用流收集器
Stream 中最强大一个终止操作是 collect() ,它接收一个收集器 Collector 作为参数,可以将流中的元素收集到集合中,或进行分组、分区等操作。Java 中内置了多种收集器的实现,可以通过 Collectors 类的静态方法进行调用,常用的收集器如下:
|-------------------|--------------------------|-------------------------------------------|
| 工厂方法 | 返回类型 | 用于 |
| toList | List<T> | 把流中所有元素收集到 List 中 |
| toSet | Set<T> | 把流中所有元素收集到 Set 中 |
| toCollection | Collection<T> | 把流中所有元素收集到指定的集合中 |
| counting | Long | 计算流中所有元素的个数 |
| summingInt | Integer | 将流中所有元素转换为整数,并计算其总和 |
| averagingInt | Double | 将流中所有元素转换为整数,并计算其平均值 |
| summarizingInt | IntSummaryStatistics | 将流中所有元素转换为整数,并返回统计结果,包含最大值、最小值、 总和与平均值等信息 |
| joining | String | 将流中所有元素转换为字符串,并使用给定连接符进行连接 |
| maxBy | Optional<T> | 查找流中最大元素的 Optional |
| minBy | Optional<T> | 查找流中最小元素的 Optional |
| reducing | 规约操作产生的类型 | 对流中所有元素执行归约操作 |
| collectingAndThen | 转换返回的类型 | 先把流中所有元素收集到指定的集合中,再对集合执行特定的操作 |
| groupingBy | Map<K,List<T>> | 对流中所有元素执行分组操作 |
| partitionBy | Map<Boolean,List<T>> | 对流中所有元素执行分区操作 |
使用示例如下:
Stream<Integer>` `stream` `=` `Stream.of(1,` `2,` `3,` `4,` `4,` `5,` `6);`
`stream.collect(Collectors.toSet());` `//` `[1,` `2,` `3,` `4,` `5,` `6]`
`stream.collect(Collectors.toList());` `//` `[1,` `2,` `3,` `4,` `4,` `5,` `6]`
`stream.collect(Collectors.toCollection(ArrayList::new));` `//` `[1,` `2,` `3,` `4,` `4,` `5,` `6]`
`stream.collect(Collectors.counting());` `//` `7 等效于 stream.count();`
`stream.collect(Collectors.summarizingInt(x` `->` `x));` `//` `IntSummaryStatistics{count=7,` `sum=25,` `min=1,` `average=3.571429,` `max=6}`
`stream.collect(Collectors.maxBy((Integer::compareTo)));` `//` `Optional[6]`
`stream.collect(Collectors.reducing(1,` `(a,` `b)` `->` `a` `*` `b));` `// 等效于 stream.reduce(1,` `(a,` `b)` `->` `a` `*` `b);`
`collect(Collectors.collectingAndThen(Collectors.toSet(),` `Set::size));` `// 先把所有元素收集到Set中,再计算Set的大小
注意:以上每个终止操作只能单独演示,因为对一个流只能执行一次终止操作。并且执行完终止操作后,就不能再对这个流进行任何操作,否则将抛出 java.lang.IllegalStateException: stream has already been operated upon or closed 的异常。
5.2 分组收集器
分组收集器可以实现类似数据库 groupBy 子句的功能。假设存在如下员工信息:
Stream<Employee>` `stream` `=` `Stream.of(new` `Employee("张某",` `"男",` `"A公司",` `20),`
`new` `Employee("李某",` `"女",` `"A公司",` `30),`
`new` `Employee("王某",` `"男",` `"B公司",` `40),`
`new` `Employee("田某",` `"女",` `"B公司",` `50));`
`public` `class` `Employee` `{`
`private` `String` `name;`
`private` `String` `gender;`
`private` `String` `company;`
`private` `int` `age;`
`@Override`
`public` `String` `toString()` `{return` `"Employee{"` `+` `"name='"` `+` `name` `+` `'\''` `+` `'}';`
`}`
`}
此时如果需要按照公司进行分组,则可以使用 groupingBy() 收集器:
stream.collect(Collectors.groupingBy(Employee::getCompany));`
`对应的分组结果如下:`
`{`
`B公司=[Employee{name='王某'},` `Employee{name='田某'}],`
`A公司=[Employee{name='张某'},` `Employee{name='李某'}]`
`}
如果想要计算分组后每家公司的人数,还可以为 groupingBy() 传递一个收集器 Collector 作为其第二个参数,调用其重载方法:
stream.collect(Collectors.groupingBy(Employee::getCompany,` `Collectors.counting()));`
`对应的结果如下:`
`{`
`B公司=2,`
`A公司=2`
`}` `
因为第二个参数是一个 Collector,这意味着你可以再传入一个分组收集器来完成多级分组,示例如下:
stream.collect(Collectors.groupingBy(Employee::getCompany,` `Collectors.groupingBy(Employee::getGender)));`
`先按照公司分组,再按照性别分组,结果如下:`
`{`
`B公司={女=[Employee{name='田某'}], 男=[Employee{name='王某'}]},`
`A公司={女=[Employee{name='李某'}], 男=[Employee{name='张某'}]}`
`}
除此之外,也可以通过代码块来自定义分组条件,示例如下:
Map<String,` `List<Employee>>` `collect` `=` `stream.collect(Collectors.groupingBy(employee` `->` `{`
`if` `(employee.getAge()` `<=` `30)` `{`
`return` `"青年员工";`
`}` `else` `if` `(employee.getAge()` `<` `50)` `{`
`return` `"中年员工";`
`}` `else` `{`
`return` `"老年员工";`
`}`
`}));`
`对应的分组结果如下:`
`{`
` 中年员工=[Employee{name='王某'}],`
` 青年员工=[Employee{name='张某'},` `Employee{name='李某'}],`
` 老年员工=[Employee{name='田某'}]`
`}` `
5.3 分区
分区是分组的一种特殊情况,即将满足指定条件的元素分为一组,将不满足指定条件的元素分为另一组,两者在使用上基本类似,示例如下:
stream.collect(Collectors.partitioningBy(x` `->` `"A公司".equals(x.getCompany())));`
`对应的分区结果如下:`
`{`
`false=[Employee{name='王某'},` `Employee{name='田某'}],`
`true=[Employee{name='张某'},` `Employee{name='李某'}]`
`}` `
6. 并行流
想要将普通流转换为并行流非常简单,只需要调用 Stream 的 parallel() 方法即可:
stream.parallel();`
`
此时流中的所有元素会被均匀的分配到多个线程上进行处理。并行流内部使用的是 ForkJoinPool 线程池,它默认的线程数量就是处理器数量,可以通过 Runtime.getRuntime().availableProcessors() 来查看该值,通常不需要更改。
当前也没有办法为某个具体的流指定线程数量,只能通过修改系统属性 java.util.concurrent.ForkJoinPool.common.parallelism 的值来改变所有并行流使用的线程数量,示例如下:
System.setProperty("java.util.concurrent.ForkJoinPool.common.parallelism","12");` `
如果想将并行流改回普通的串行流,则只需要调用 Stream 的 sequential() 方法即可:
stream.sequential();`
`