技术栈
Spark,RDD中的转换算子
猪猪果泡酒
2025-05-14 8:25
RDD中的转换算子
map算子
对数字1-10进行乘除,*2
filter算子
对数字1-10进行过滤,过滤出偶数
filatMap算子
对单词进行拆分
reduceByKey算子
对具有相同键的所有值进行聚合操作 = 统计词频
词频统计简洁写法
大数据
分布式
spark
上一篇:
flinksql实践(从kafka读数据)
下一篇:
JIT+Opcache如何配置才能达到性能最优
相关推荐
唐天下文化
几秒前
居然智家亮相全零售AI火花大会 AI大模型赋能家居新零售的进阶之路
大数据
·
人工智能
·
零售
gaosushexiangji
16 分钟前
应用探析|千眼狼PIV测量系统在职业病防治中的应用
大数据
·
人工智能
·
科技
·
数码相机
18922804861
19 分钟前
NY182NY183美光固态颗粒NY186NY188
大数据
·
网络
·
科技
爱吃香菜---www
2 小时前
spark-standalone
大数据
·
分布式
·
spark
依年南台
2 小时前
安装Hadoop并运行WordCount程序
大数据
·
hadoop
TDengine (老段)
3 小时前
基于 TSBS 标准数据集下 TimescaleDB、InfluxDB 与 TDengine 性能对比测试报告
java
·
大数据
·
开发语言
·
数据库
·
时序数据库
·
tdengine
·
iotdb
TDengine (老段)
3 小时前
TDengine 在金融领域的应用
大数据
·
数据库
·
物联网
·
金融
·
时序数据库
·
tdengine
·
涛思数据
懒惰的橘猫
3 小时前
RDD-自定义分区器案例
大数据
rylshe1314
3 小时前
spark sql基本操作
sql
·
spark
zandy1011
4 小时前
高并发场景下的BI架构设计:衡石分布式查询引擎与缓存分级策略
分布式
·
缓存
·
高并发架构
·
弹性扩展
·
分布式查询
·
缓存分级
·
mpp引擎
热门推荐
01
YOLOv8入门 | 重要性能衡量指标、训练结果评价及分析及影响mAP的因素【发论文关注的指标】
02
从零安装 LLaMA-Factory 微调 Qwen 大模型成功及所有的坑
03
KGG转MP3工具|非KGM文件|解密音频
04
组基轨迹建模 GBTM的介绍与实现(Stata 或 R)
05
【SpeedAI科研小助手】2分钟极速解决知网维普重复率、AIGC率过高,一键全文降!文件格式不变,公式都保留的!
06
Coze扣子平台完整体验和实践(附国内和国际版对比)
07
YOLOv5改进 | 添加CA注意力机制 + 增加预测层 + 更换损失函数之GIoU
08
yolov8,yolo11,yolo12 服务器训练到部署全流程 笔记
09
DeepSeek各版本说明与优缺点分析
10
【解决】Android Gradle Sync 报错 Could not read workspace metadata