Spark,RDD中的行动算子

RDD中的行动算子

collect算子

格式:def collect(): Array[T]

参数说明:该算子没有参数。

并以数组的形式返回

统计个数

reduce算子

格式:def reduce(func: (T, T) => T): T

返回值:返回一个单一的值,其类型与 RDD 中元素的类型相同。

count,聚合操作 eg:计算rdd中的元素之和

foreach算子

格式:def foreach(f: T => Unit): Unit

返回值:该算子的返回类型为 Unit,即不返回任何有意义的值,它主要是为了执行副作用操作。

遍历操作

相关推荐
SelectDB35 分钟前
森马服饰从 Elasticsearch 到阿里云 SelectDB 的架构演进之路
大数据·数据库·数据分析
Hello.Reader1 小时前
Elasticsearch 混合检索一句 `retriever.rrf`,把语义召回与关键词召回融合到极致
大数据·elasticsearch·搜索引擎
Freed&1 小时前
倒排索引:Elasticsearch 搜索背后的底层原理
大数据·elasticsearch·搜索引擎·lucene
bemyrunningdog1 小时前
IntelliJIDEA上传GitHub全攻略
大数据·elasticsearch·搜索引擎
小傅哥3 小时前
【分享】拼团交易平台系统,分布式、高并发、微服务
分布式·微服务·状态模式
九河云3 小时前
电商直播流量爆发式增长,华为云分布式流量治理与算力调度服务的应用场景剖析
分布式·科技·华为云·电商·传统
TDengine (老段)5 小时前
TDengine 中 TDgp 中添加算法模型(异常检测)
java·大数据·数据库·算法·时序数据库·tdengine·涛思数据
2501_924748246 小时前
高密度客流识别精度↑32%!陌讯多模态融合算法在智慧交通的实战解析
大数据·人工智能·算法·目标检测·计算机视觉
腾讯云qcloud07556 小时前
不办理腾讯地图商业授权有什么影响?
大数据
归梧谣7 小时前
部署Zabbix企业级分布式监控
分布式·zabbix