如何搭建Spark YARN模式的集群

如何搭建Spark YARN模式的集群

  • 节点规划:1个主节点(Master)+ N个工作节点(Worker),需安装Java、Hadoop、Spark。

  • 配置YARN:修改Hadoop的 yarn-site.xml ,启用ResourceManager和NodeManager。

Spark配置

  1. 修改Spark参数
  • 编辑 conf/spark-env.sh ,添加:

export HADOOP_CONF_DIR=/path/to/hadoop/conf

export SPARK_MASTER_IP=主节点IP

  1. 配置 slaves 文件
  • 在 conf/slaves 中列出所有Worker节点IP(每行一个)。

启动集群

  1. 启动Hadoop:

start-dfs.sh # 启动HDFS

start-yarn.sh # 启动YARN

  1. 启动Spark集群:

./sbin/start-all.sh # 在主节点执行

验证

  • 访问YARN界面(默认端口8088),查看Spark应用队列。

  • 提交测试任务:

spark-submit --master yarn --class org.apache.spark.examples.SparkPi /path/to/spark-examples.jar 10

相关推荐
铭哥的编程日记10 分钟前
【Linux网络】传输层协议TCP
linux·网络·tcp/ip
它说我会飞耶27 分钟前
开机视频动画
linux
大聪明-PLUS1 小时前
Linux 上的 GitOps:使用 Git 进行无缝基础设施管理
linux·嵌入式·arm·smarc
LCG元1 小时前
Linux 环境变量 PATH 详解:为什么你装的命令"找不到"?
linux
web安全工具库2 小时前
Linux进程的:深入理解子进程回收与僵尸进程
java·linux·数据库
赖small强2 小时前
Linux 用户态与内核态及其切换机制
linux·内核态·用户态(user mode)·硬件中断与异常·调度与抢占
偶像你挑的噻2 小时前
Linux应用开发-17-套接字
linux·网络·stm32·嵌入式硬件
by__csdn3 小时前
nvm命令使用,nvm国内镜像,nvm命令for Linux/Mac
linux·运维·macos
su3173 小时前
rap2部署
linux·运维·服务器
wheeldown4 小时前
【Linux】Linux 地址空间 + 页表映射的概念解析
java·linux·jvm