使用idea开发spark程序

新建scala 项目

创建lib目录

将spark jars/ 路径下所有jar 复制到 lib目录

添加依赖

创建scala 程序

Scala 复制代码
package spark

import org.apache.spark.{SparkConf, SparkContext}

object WordCount {
  def main(args: Array[String]): Unit = {
    
    val conf = new SparkConf().setAppName("WordCount").setMaster("local") //本地模式
    //    val conf = new SparkConf().setAppName("WordCount") //集群模式s
    val sc = new SparkContext(conf)

    val result = sc.textFile("hdfs://bigdata112:9000/user/test001.txt")
      .flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)
      .collect
    result.foreach(println)

    println("Hello, World!")
  }
  
}

准备测试数据

上传hdfs

hdfs dfs -put test001.txt /user/

运行程序

相关推荐
皮皮林5511 天前
IDEA 源码阅读利器,你居然还不会?
java·intellij idea
卡尔特斯1 天前
Android Kotlin 项目代理配置【详细步骤(可选)】
android·java·kotlin
白鲸开源1 天前
Ubuntu 22 下 DolphinScheduler 3.x 伪集群部署实录
java·ubuntu·开源
ytadpole1 天前
Java 25 新特性 更简洁、更高效、更现代
java·后端
纪莫1 天前
A公司一面:类加载的过程是怎么样的? 双亲委派的优点和缺点? 产生fullGC的情况有哪些? spring的动态代理有哪些?区别是什么? 如何排查CPU使用率过高?
java·java面试⑧股
JavaGuide1 天前
JDK 25(长期支持版) 发布,新特性解读!
java·后端
用户3721574261351 天前
Java 轻松批量替换 Word 文档文字内容
java
白鲸开源1 天前
教你数分钟内创建并运行一个 DolphinScheduler Workflow!
java
Java中文社群1 天前
有点意思!Java8后最有用新特性排行榜!
java·后端·面试
代码匠心1 天前
从零开始学Flink:数据源
java·大数据·后端·flink