Scala课后总结(8)

集合计算高级函数

过滤(filter)

从集合里挑出符合特定条件元素组成新集合 。比如从整数集合里选出偶数, list.filter(x => x % 2 == 0) ,就是筛选出能被2整除的元素。

转化/映射(map)

对集合每个元素应用一个函数,得到新元素组成新集合。像 list.map(x => x + 1) ,会把集合里每个数都加1 。

扁平化(flatten)

把嵌套集合(集合里元素还是集合)展开成单一层次集合。如 List(List(1, 2), List(3, 4)) 经 flatten 后变为 List(1, 2, 3, 4) 。

扁平化 + 映射(flatMap)

先对集合元素映射处理,再扁平化。例如对字符串集合按空格拆分后再合并, wordList.flatMap(x => x.split(" ")) 。

分组(groupBy)

按指定规则把集合元素分组。像 list.groupBy(x => x % 2) ,会按元素除以2的余数把元素分组。

简化(归约):通过某种运算把集合元素合并成一个值。

折叠:和归约类似,不过多了个初始值参与运算。

Reduce方法

概念:通过特定逻辑聚合集合数据,减少数据量得到结果 。

Fold方法

概念:是 Reduce 简化的特殊情况

两个集合并

定义两个可变 Map : map1 和 map2 。

用 foldLeft 方法将 map2 合并到 map1 ,遍历 map2 ,若 map1 有相同键则值相加,没有则添加键值对到 map1 ,最终得到合并后的 map3

相关推荐
小伍_Five1 天前
Spark实战能力测评模拟题精析【模拟考】
java·大数据·spark·scala·intellij-idea
黄雪超2 天前
DataStreamAPI实践原理——快速上手(实操详细版)
大数据·flink·scala
白总Server3 天前
C++语法架构解说
java·网络·c++·网络协议·架构·golang·scala
vortex54 天前
Perl One-liner 数据处理——基础语法篇【匠心】
开发语言·scala·perl
老兵发新帖6 天前
Coursier:安装sbt
scala
请你喝好果汁6419 天前
indel_snp_ssr_primer
大数据·开发语言·scala
MZWeiei12 天前
Spark 中,map和foreach的区别
大数据·分布式·spark·scala
MZWeiei13 天前
区分:union(),coalesce () 和 repartition ()
大数据·分布式·spark·scala
北漂老男孩13 天前
Scala与Spark:原理、实践与技术全景详解
大数据·开发语言·spark·scala·学习方法
MZWeiei13 天前
Spark 中,创建 DataFrame 的方式(Scala语言)
大数据·分布式·spark·scala