技术栈
Spark,RDD中的转换算子
猪猪果泡酒
2025-05-14 8:25
RDD中的转换算子
map算子
对数字1-10进行乘除,*2
filter算子
对数字1-10进行过滤,过滤出偶数
filatMap算子
对单词进行拆分
reduceByKey算子
对具有相同键的所有值进行聚合操作 = 统计词频
词频统计简洁写法
大数据
分布式
spark
上一篇:
flinksql实践(从kafka读数据)
下一篇:
JIT+Opcache如何配置才能达到性能最优
相关推荐
数翊科技
14 分钟前
深度解析 HexaDB分布式 DDL 的全局一致性
分布式
Sylvan Ding
27 分钟前
度量空间数据管理与分析系统——大数据泛构课程作业-2025~2026学年. 毛睿
大数据
·
深圳大学
·
大数据泛构
·
度量空间数据管理与分析系统
·
毛睿
·
北京理工大学珠海校区
面向Google编程
3 小时前
Flink源码阅读:JobManager的HA机制
大数据
·
flink
Tony Bai
3 小时前
【分布式系统】03 复制(上):“权威中心”的秩序 —— 主从架构、一致性与权衡
大数据
·
数据库
·
分布式
·
架构
汽车仪器仪表相关领域
5 小时前
全自动化精准检测,赋能高效年检——NHD-6108全自动远、近光检测仪项目实战分享
大数据
·
人工智能
·
功能测试
·
算法
·
安全
·
自动化
·
压力测试
大厂技术总监下海
5 小时前
根治LLM胡说八道!用 Elasticsearch 构建 RAG,给你一个“有据可查”的AI
大数据
·
elasticsearch
·
开源
石像鬼₧魂石
7 小时前
22端口(OpenSSH 4.7p1)渗透测试完整复习流程(含实战排错)
大数据
·
网络
·
学习
·
安全
·
ubuntu
TDengine (老段)
8 小时前
TDengine Python 连接器进阶指南
大数据
·
数据库
·
python
·
物联网
·
时序数据库
·
tdengine
·
涛思数据
数据猿
10 小时前
【金猿CIO展】如康集团CIO 赵鋆洲:数智重塑“顶牛”——如康集团如何用大数据烹饪万亿肉食产业的未来
大数据
txinyu的博客
11 小时前
HTTP服务实现用户级窗口限流
开发语言
·
c++
·
分布式
·
网络协议
·
http
热门推荐
01
GitHub 镜像站点
02
Labelme从安装到标注:零基础完整指南
03
安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)
04
Linux下V2Ray安装配置指南
05
Claude Code 2.1.2 升级报错?别折腾了,一行命令搞定
06
2025-04-03 Latex学习1——本地配置Latex + VScode环境
07
网站改了域名,如何查找?
08
【踩坑笔记】50系显卡适配的 PyTorch 安装
09
KGG转MP3工具|非KGM文件|解密音频
10
jdk21下载、安装(Windows、Linux、macOS)