Spark,RDD中的行动算子

RDD中的行动算子

collect算子

格式:def collect(): Array[T]

参数说明:该算子没有参数。

并以数组的形式返回

统计个数

reduce算子

格式:def reduce(func: (T, T) => T): T

返回值:返回一个单一的值,其类型与 RDD 中元素的类型相同。

count,聚合操作 eg:计算rdd中的元素之和

foreach算子

格式:def foreach(f: T => Unit): Unit

返回值:该算子的返回类型为 Unit,即不返回任何有意义的值,它主要是为了执行副作用操作。

遍历操作

相关推荐
中电金信4 分钟前
重构金融数智化产业版图:中电金信“链主”之道
大数据·人工智能
七七-d11 分钟前
配置Hadoop集群-上传文件
大数据·hadoop·eclipse
信徒_39 分钟前
Kafka topic 中的 partition 数据倾斜问题
分布式·kafka
Paraverse_徐志斌40 分钟前
Kafka 如何保证消息顺序性
分布式·中间件·kafka·消息队列
心仪悦悦2 小时前
Spark缓存
大数据·缓存·spark
我叫珂蛋儿吖2 小时前
[redis进阶六]详解redis作为缓存&&分布式锁
运维·c语言·数据库·c++·redis·分布式·缓存
lix的小鱼2 小时前
安装Hadoop并运行WordCount程序
大数据·linux·hadoop
七七-d2 小时前
测试集群的功能-执行wordcount程序
大数据
Freedom℡2 小时前
spark Mysql数据库配置
spark
INFINI Labs3 小时前
INFINI Console 纳管 Elasticsearch 9(一):指标监控、数据管理、DSL 语句执行
大数据·elasticsearch·搜索引擎·console