Spark学习基础转换算子案例(单词计数(WordCount))

本案例在文件中读取,上面是文件路径

这是文件内容

代码如下:

java 复制代码
package RDD.test;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;

import java.util.Arrays;

public class RDD_test_WordCount {

    public static void main(String[] args) {
        SparkConf sparkConf = new SparkConf().setMaster("local").setAppName("sparkcore");

        JavaSparkContext context = new JavaSparkContext(sparkConf);

        JavaRDD<String> rdd = context.textFile("data/word.txt");

        JavaRDD<String> rdd1 = rdd.flatMap(line -> Arrays.asList(line.split(" ")).iterator());

        JavaPairRDD<String, Iterable<String>> stringIterableJavaPairRDD = rdd1.groupBy(num -> num);

        JavaPairRDD<String, Integer> stringIntegerJavaPairRDD = stringIterableJavaPairRDD.mapValues(
                ite -> {
                    int len = 0;
                    for (String s : ite) {
                        len++;
                    }

                    return len;
                }
        );

        stringIntegerJavaPairRDD.collect().forEach(System.out::println);

        context.close();

    }
}

运行结果为:

相关推荐
智慧景区与市集主理人35 分钟前
巨有科技会员积分系统|深耕私域存量,破解景区复购增收难题
大数据·科技
石山代码1 小时前
ArrayList / HashMap / ConcurrentHashMap
java·开发语言
AskHarries2 小时前
系统提示词、开发者指令和用户输入的优先级
java·前端·数据库
secondyoung2 小时前
Cortex-R52学习:MPU内存保护机制
arm开发·单片机·学习·arm·mpu
Litluecat2 小时前
2026年6月1日科技热点新闻
大数据·人工智能·科技·推荐·热点·新闻·每日
red_redemption2 小时前
自由学习记录(198)
学习
花岛溯3 小时前
Cursor 学习 DAY2·切换AI模型
学习
星夜夏空993 小时前
FreeRTOS学习(9)——临界区
学习
daidaidaiyu3 小时前
ThingsBoard 规则链系统源码分析和自定义定时器
java
志栋智能3 小时前
AI驱动无代码:降低巡检超自动化的门槛
大数据·运维·网络·人工智能·自动化