使用idea开发spark程序

新建scala 项目

创建lib目录

将spark jars/ 路径下所有jar 复制到 lib目录

添加依赖

创建scala 程序

Scala 复制代码
package spark

import org.apache.spark.{SparkConf, SparkContext}

object WordCount {
  def main(args: Array[String]): Unit = {
    
    val conf = new SparkConf().setAppName("WordCount").setMaster("local") //本地模式
    //    val conf = new SparkConf().setAppName("WordCount") //集群模式s
    val sc = new SparkContext(conf)

    val result = sc.textFile("hdfs://bigdata112:9000/user/test001.txt")
      .flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)
      .collect
    result.foreach(println)

    println("Hello, World!")
  }
  
}

准备测试数据

上传hdfs

hdfs dfs -put test001.txt /user/

运行程序

相关推荐
期待のcode1 分钟前
Springboot主配置文件
java·spring boot·后端
亲爱的马哥8 分钟前
填鸭表单!开箱即用的开源问卷调查系统!
java·前端·低代码·产品经理
❀͜͡傀儡师19 分钟前
JDK 25 新特性速览
java·开发语言
兮动人25 分钟前
主流JDK版本支持时间
java·开发语言·主流jdk版本支持时间
学习中的程序媛~35 分钟前
Spring 事务(@Transactional)与异步(@Async / CompletableFuture)结合的陷阱与最佳实践
java·数据库·sql
m0_5656111337 分钟前
Java高级特性:单元测试、反射、注解、动态代理
java·单元测试·log4j
锻炼²38 分钟前
(已解决)vscode打开stm32cubemx生成的工程报红色波浪线警告
ide·vscode·stm32·stm32cubemx·vscode打开keil工程
雾林小妖1 小时前
springboot实现跨服务调用/springboot调用另一台机器上的服务
java·spring boot·后端
百***58141 小时前
Windows操作系统部署Tomcat详细讲解
java·windows·tomcat
Boop_wu1 小时前
[Java EE] 多线程 -- 初阶(3)
java·开发语言