Scala课后总结(8)

集合计算高级函数

过滤(filter)

从集合里挑出符合特定条件元素组成新集合 。比如从整数集合里选出偶数, list.filter(x => x % 2 == 0) ,就是筛选出能被2整除的元素。

转化/映射(map)

对集合每个元素应用一个函数,得到新元素组成新集合。像 list.map(x => x + 1) ,会把集合里每个数都加1 。

扁平化(flatten)

把嵌套集合(集合里元素还是集合)展开成单一层次集合。如 List(List(1, 2), List(3, 4)) 经 flatten 后变为 List(1, 2, 3, 4) 。

扁平化 + 映射(flatMap)

先对集合元素映射处理,再扁平化。例如对字符串集合按空格拆分后再合并, wordList.flatMap(x => x.split(" ")) 。

分组(groupBy)

按指定规则把集合元素分组。像 list.groupBy(x => x % 2) ,会按元素除以2的余数把元素分组。

简化(归约):通过某种运算把集合元素合并成一个值。

折叠:和归约类似,不过多了个初始值参与运算。

Reduce方法

概念:通过特定逻辑聚合集合数据,减少数据量得到结果 。

Fold方法

概念:是 Reduce 简化的特殊情况

两个集合并

定义两个可变 Map : map1 和 map2 。

用 foldLeft 方法将 map2 合并到 map1 ,遍历 map2 ,若 map1 有相同键则值相加,没有则添加键值对到 map1 ,最终得到合并后的 map3

相关推荐
Java水解9 天前
Scala深入面向对象:类、对象与伴生关系
后端·scala
哈哈很哈哈13 天前
Spark 核心 RDD详解
大数据·分布式·spark·scala
DTS小夏13 天前
Linux 系统 + IDEA+Scala 插件:新手进阶开发指南
linux·scala·intellij-idea
渣渣盟15 天前
Spark核心:单跳转换率计算全解析
大数据·spark·scala·apache
闯闯桑16 天前
Spark 中spark.implicits._ 中的 toDF和DataFrame 类本身的 toDF 方法
大数据·ajax·spark·scala
MOMO陌染18 天前
IDEA环境搭建与输出
scala
闯闯桑20 天前
toDF(columns: _*) 语法
开发语言·前端·spark·scala·apache
q5673152321 天前
无需Python:Shell脚本如何成为你的自动化爬虫引擎?
开发语言·爬虫·python·自动化·scala
渣渣盟23 天前
Spark自定义累加器实现高效WordCount
大数据·spark·scala
IvanCodes24 天前
一、Scala 基础语法、变量与数据类型
大数据·开发语言·scala