技术栈
Spark,RDD中的转换算子
猪猪果泡酒
2025-05-14 8:25
RDD中的转换算子
map算子
对数字1-10进行乘除,*2
filter算子
对数字1-10进行过滤,过滤出偶数
filatMap算子
对单词进行拆分
reduceByKey算子
对具有相同键的所有值进行聚合操作 = 统计词频
词频统计简洁写法
大数据
分布式
spark
上一篇:
flinksql实践(从kafka读数据)
下一篇:
JIT+Opcache如何配置才能达到性能最优
相关推荐
字节跳动数据平台
19 分钟前
多模态数据湖技术深化,Data Agent新能力发布!“认知”将决定企业上限
大数据
字节跳动数据平台
1 小时前
得物×火山引擎:Data Agent驱动财务管理智能升级
大数据
想ai抽
1 小时前
Spark的shuffle类型与对比
大数据
·
数据仓库
·
spark
智海观潮
2 小时前
JVM垃圾回收器、内存分配与回收策略
java
·
大数据
·
jvm
回家路上绕了弯
2 小时前
外卖员重复抢单?从技术到运营的全链路解决方案
分布式
·
后端
B站_计算机毕业设计之家
2 小时前
机器学习:基于大数据的基金数据分析可视化系统 股票数据 金融数据 股价 Django框架 大数据技术(源码) ✅
大数据
·
python
·
金融
·
数据分析
·
股票
·
etf
·
基金
忍冬行者
3 小时前
Kafka 概念与部署手册
分布式
·
kafka
墨香幽梦客
3 小时前
塑胶制造生产ERP:有哪些系统值得关注
大数据
·
人工智能
·
制造
cliproxydaili
3 小时前
IP 汇总名单
大数据
·
网络
深蓝电商API
3 小时前
爬虫+Redis:如何实现分布式去重与任务队列?
redis
·
分布式
·
爬虫
·
python
热门推荐
01
GitHub 镜像站点
02
BongoCat - 跨平台键盘猫动画工具
03
UV安装并设置国内源
04
GitLab 零基础入门指南:从安装到项目管理全流程
05
Linux下V2Ray安装配置指南
06
一文了解国产算子编程语言 TileLang,TileLang 对国产开源生态的影响与启示
07
NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南
08
在VSCode配置Java开发环境的保姆级教程(适配各类AI编程IDE)
09
2025软件测试面试八股文(含答案+文档)
10
KGG转MP3工具|非KGM文件|解密音频