如何在sheel中运行spark

// 读取文件,得到RDD

val rdd1 = sc.textFile("hdfs://hadoop100:8020/wcinput/words.txt")

// 将单词进行切割,得到一个存储全部单词的RDD

val rdd2= fileRDD.flatMap(line => line.split(" "))

// 将单词转换为元组对象,key是单词,value是数字1

val rdd3= wordsRDD.map(word => (word, 1))

// 将元组的value按照key来分组,对所有的value执行聚合操作(相加)

val rdd4= wordsWithOneRDD.reduceByKey((a, b) => a + b)

// 收集RDD的数据并打印输出结果

// 读取文件,得到RDD

val rdd1 = sc.textFile("hdfs://hadoop100:8020/wcinput/words.txt")

// 将单词进行切割,得到一个存储全部单词的RDD

val rdd2= fileRDD.flatMap(line => line.split(" "))

// 将单词转换为元组对象,key是单词,value是数字1

val rdd3= wordsRDD.map(word => (word, 1))

// 将元组的value按照key来分组,对所有的value执行聚合操作(相加)

val rdd4= wordsWithOneRDD.reduceByKey((a, b) => a + b)

// 收集RDD的数据并打印输出结果

相关推荐
查古穆6 分钟前
python进阶-Pydantic模型
开发语言·python
沐知全栈开发9 分钟前
Bootstrap4 导航栏
开发语言
kyriewen1112 分钟前
异步编程:从“回调地狱”到“async/await”的救赎之路
开发语言·前端·javascript·chrome·typescript·ecmascript·html5
AI+程序员在路上14 分钟前
嵌入式软件技术大全
linux·开发语言·arm开发·单片机
吴声子夜歌15 分钟前
JavaScript——数据类型
开发语言·javascript·ecmascript
RoboWizard28 分钟前
本地AI主机批量部署 高效存储支撑全场景配置
大数据·人工智能
dingzd9529 分钟前
产品同质化严重如何用材质升级做出溢价空间
大数据·人工智能·跨境电商·内容营销
@PHARAOH35 分钟前
WHAT - AI 时代下的候选人
大数据·前端·人工智能
Data-Miner35 分钟前
50页精品PPT | 数据安全运营体系建设方案
大数据·数据分析
2401_8796938735 分钟前
C++中的观察者模式实战
开发语言·c++·算法