使用idea开发spark程序

新建scala 项目

创建lib目录

将spark jars/ 路径下所有jar 复制到 lib目录

添加依赖

创建scala 程序

Scala 复制代码
package spark

import org.apache.spark.{SparkConf, SparkContext}

object WordCount {
  def main(args: Array[String]): Unit = {
    
    val conf = new SparkConf().setAppName("WordCount").setMaster("local") //本地模式
    //    val conf = new SparkConf().setAppName("WordCount") //集群模式s
    val sc = new SparkContext(conf)

    val result = sc.textFile("hdfs://bigdata112:9000/user/test001.txt")
      .flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)
      .collect
    result.foreach(println)

    println("Hello, World!")
  }
  
}

准备测试数据

上传hdfs

hdfs dfs -put test001.txt /user/

运行程序

相关推荐
heartbeat..5 分钟前
Java Map 详解:原理、实现与使用场景
java·map·集合
果然途游11 分钟前
完整Java后端学习路径
java·开发语言·学习笔记
又是重名了12 分钟前
导出新方案-poi和easyexcel融合
java·poi·easyexcel
uup14 分钟前
看似简单的空指针 —— 包装类自动拆箱陷阱
java
天天摸鱼的java工程师18 分钟前
Docker+K8s 部署微服务:从搭建到运维的全流程指南(Java 老鸟实战版)
java·后端
用户83071968408219 分钟前
Apache Tomcat 体系结构深度解析
java·tomcat
管理大亨24 分钟前
企业级ELK:从日志收集到业务驱动
java·大数据·网络·数据库·elk·elasticsearch
BBB努力学习程序设计26 分钟前
Java并发包深度解析:从AQS到线程池的完全指南
java
xing-xing28 分钟前
Java集合Map总结
java
古城小栈28 分钟前
性能边界:何时用 Go 何时用 Java 的技术选型指南
java·后端·golang