Spark,RDD中的行动算子

RDD中的行动算子

collect算子

格式:def collect(): Array[T]

参数说明:该算子没有参数。

并以数组的形式返回

统计个数

reduce算子

格式:def reduce(func: (T, T) => T): T

返回值:返回一个单一的值,其类型与 RDD 中元素的类型相同。

count,聚合操作 eg:计算rdd中的元素之和

foreach算子

格式:def foreach(f: T => Unit): Unit

返回值:该算子的返回类型为 Unit,即不返回任何有意义的值,它主要是为了执行副作用操作。

遍历操作

相关推荐
头歌实践平台1 小时前
招聘大数据可视化
大数据·python
头歌实践平台1 小时前
Hadoop开发环境搭建
java·大数据·hadoop
Alter12301 小时前
从“力大砖飞”到“拟态共生”,新华三定义AI基础设施的系统级进化
大数据·运维·人工智能
2501_928817122 小时前
大模型如何决定推荐谁?拆解精准触达的底层算法工艺
大数据
qq_297574672 小时前
第十四篇:RabbitMQ监控与日志分析——快速排查线上问题
分布式·rabbitmq·ruby
ApacheSeaTunnel2 小时前
AI 让 SeaTunnel 读源码和调试过时了吗?
大数据·ai·开源·数据集成·seatunnel·技术分享·数据同步
TDengine (老段)2 小时前
MNode 内部机制深度解析 — SDB、事务引擎与 DDL 处理全链路
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
白鲸开源2 小时前
杀疯了!SeaTunnel AI CLI 解锁数据集成新玩法
大数据·人工智能·github
Elastic 中国社区官方博客3 小时前
在 Elasticsearch 中使用利润率与流行度加权来优化电商搜索
大数据·数据库·elasticsearch·搜索引擎·全文检索