如何在sheel中运行spark

// 读取文件,得到RDD

val rdd1 = sc.textFile("hdfs://hadoop100:8020/wcinput/words.txt")

// 将单词进行切割,得到一个存储全部单词的RDD

val rdd2= fileRDD.flatMap(line => line.split(" "))

// 将单词转换为元组对象,key是单词,value是数字1

val rdd3= wordsRDD.map(word => (word, 1))

// 将元组的value按照key来分组,对所有的value执行聚合操作(相加)

val rdd4= wordsWithOneRDD.reduceByKey((a, b) => a + b)

// 收集RDD的数据并打印输出结果

// 读取文件,得到RDD

val rdd1 = sc.textFile("hdfs://hadoop100:8020/wcinput/words.txt")

// 将单词进行切割,得到一个存储全部单词的RDD

val rdd2= fileRDD.flatMap(line => line.split(" "))

// 将单词转换为元组对象,key是单词,value是数字1

val rdd3= wordsRDD.map(word => (word, 1))

// 将元组的value按照key来分组,对所有的value执行聚合操作(相加)

val rdd4= wordsWithOneRDD.reduceByKey((a, b) => a + b)

// 收集RDD的数据并打印输出结果

相关推荐
新缸中之脑2 分钟前
Moltbook 帖子精选
开发语言·php
LaughingZhu11 分钟前
Product Hunt 每日热榜 | 2026-01-31
大数据·人工智能·经验分享·搜索引擎·产品运营
xyq202412 分钟前
jQuery Mobile 表单选择
开发语言
babe小鑫14 分钟前
中专学历进入快消大厂终端销售岗位的可行性分析
大数据
samFuB17 分钟前
【工具变量】区县5A级旅游景区DID数据集(2000-2025年)
大数据
青岑CTF18 分钟前
攻防世界-Web_php_include-胎教版wp
开发语言·安全·web安全·网络安全·php
雾岛听蓝25 分钟前
C++11 列表初始化与右值引用核心解析
开发语言·c++·经验分享
百夜﹍悠ゼ28 分钟前
数据治理DataHub安装部署
大数据·数据治理
小北方城市网35 分钟前
Spring Boot 多数据源与事务管理实战:主从分离、动态切换与事务一致性
java·开发语言·jvm·数据库·mysql·oracle·mybatis
痴儿哈哈36 分钟前
C++与硬件交互编程
开发语言·c++·算法