Spark,RDD中的行动算子

RDD中的行动算子

collect算子

格式:def collect(): Array[T]

参数说明:该算子没有参数。

并以数组的形式返回

统计个数

reduce算子

格式:def reduce(func: (T, T) => T): T

返回值:返回一个单一的值,其类型与 RDD 中元素的类型相同。

count,聚合操作 eg:计算rdd中的元素之和

foreach算子

格式:def foreach(f: T => Unit): Unit

返回值:该算子的返回类型为 Unit,即不返回任何有意义的值,它主要是为了执行副作用操作。

遍历操作

相关推荐
Hello.Reader18 小时前
从 0 到 1 跑通第一个 Flink ML 示例
大数据·python·flink
zhangkaixuan45618 小时前
Flink Checkpoint 全生命周期深度解析
大数据·hadoop·flink·apache·paimon
Xyz996_18 小时前
Ceph分布式存储
分布式·ceph
梦里不知身是客1119 小时前
flink自定义反序列化工具
大数据·flink
以山河作礼。19 小时前
解锁全球旅游数据:动态代理+AI智能推荐实战
大数据·人工智能·数据分析
翰德恩咨询19 小时前
BLM咨询洞察:破解企业成功悖论的战略框架
大数据·blm
绝顶少年19 小时前
Redis 五大核心应用场景实战解析:缓存、会话、排行榜、分布式锁与消息队列
redis·分布式·缓存
数峦云数字孪生三维可视化19 小时前
魔观3DS智慧工厂数字孪生立体监测系统:让数字孪生“立体可感”的智能中枢
大数据·人工智能·物联网·信息可视化·数字孪生
新诺韦尔API19 小时前
手机在网状态查询接口对接详细流程
大数据·网络·智能手机·api
武子康19 小时前
Java-181 OSS 实战指南:Bucket/外链/防盗链/计费与常见坑
java·大数据·分布式·oss·云存储·fastdfs·ali