Scala课后总结(8)

集合计算高级函数

过滤(filter)

从集合里挑出符合特定条件元素组成新集合 。比如从整数集合里选出偶数, list.filter(x => x % 2 == 0) ,就是筛选出能被2整除的元素。

转化/映射(map)

对集合每个元素应用一个函数,得到新元素组成新集合。像 list.map(x => x + 1) ,会把集合里每个数都加1 。

扁平化(flatten)

把嵌套集合(集合里元素还是集合)展开成单一层次集合。如 List(List(1, 2), List(3, 4)) 经 flatten 后变为 List(1, 2, 3, 4) 。

扁平化 + 映射(flatMap)

先对集合元素映射处理,再扁平化。例如对字符串集合按空格拆分后再合并, wordList.flatMap(x => x.split(" ")) 。

分组(groupBy)

按指定规则把集合元素分组。像 list.groupBy(x => x % 2) ,会按元素除以2的余数把元素分组。

简化(归约):通过某种运算把集合元素合并成一个值。

折叠:和归约类似,不过多了个初始值参与运算。

Reduce方法

概念:通过特定逻辑聚合集合数据,减少数据量得到结果 。

Fold方法

概念:是 Reduce 简化的特殊情况

两个集合并

定义两个可变 Map : map1 和 map2 。

用 foldLeft 方法将 map2 合并到 map1 ,遍历 map2 ,若 map1 有相同键则值相加,没有则添加键值对到 map1 ,最终得到合并后的 map3

相关推荐
是阿威啊5 天前
【用户行为归因分析项目】- 【企业级项目开发第五站】数据采集并加载到hive表
大数据·数据仓库·hive·hadoop·spark·scala
是阿威啊8 天前
【用户行为归因分析项目】- 【企业级项目开发第四站】模拟三类用户行为数据上传到Hadoop
大数据·hadoop·分布式·sql·scala
今天没有盐10 天前
Python字符串操作全解析:从基础定义到高级格式化
后端·scala·编程语言
是阿威啊11 天前
【用户行为归因分析项目】- 【企业级项目开发第一站】项目架构和需求设计
大数据·hive·hadoop·架构·spark·scala
代码于老总13 天前
【Scala 技巧】用隐式类给 String “开挂”:一行代码实现手机号 / 身份证号校验
scala
scala舔狗汪13 天前
scala的隐式对象和隐式类
scala
是阿威啊14 天前
【maap-analysis】spark离线数仓项目完整的开发流程
大数据·分布式·spark·scala
豚踢兔x19 天前
正则表达式应用-手机号打码
scala
代码于老总20 天前
正则表达式在 Scala 中的应用
scala
凯新生物1 个月前
聚乙二醇二生物素,Biotin-PEG-Biotin在生物检测中的应用
scala·bash·laravel·perl