如何搭建Spark YARN模式的集群

如何搭建Spark YARN模式的集群

  • 节点规划:1个主节点(Master)+ N个工作节点(Worker),需安装Java、Hadoop、Spark。

  • 配置YARN:修改Hadoop的 yarn-site.xml ,启用ResourceManager和NodeManager。

Spark配置

  1. 修改Spark参数
  • 编辑 conf/spark-env.sh ,添加:

export HADOOP_CONF_DIR=/path/to/hadoop/conf

export SPARK_MASTER_IP=主节点IP

  1. 配置 slaves 文件
  • 在 conf/slaves 中列出所有Worker节点IP(每行一个)。

启动集群

  1. 启动Hadoop:

start-dfs.sh # 启动HDFS

start-yarn.sh # 启动YARN

  1. 启动Spark集群:

./sbin/start-all.sh # 在主节点执行

验证

  • 访问YARN界面(默认端口8088),查看Spark应用队列。

  • 提交测试任务:

spark-submit --master yarn --class org.apache.spark.examples.SparkPi /path/to/spark-examples.jar 10

相关推荐
云qq1 小时前
x86操作系统19——键盘驱动
linux·c语言·汇编
路溪非溪1 小时前
关于蓝牙技术的再补充
linux
爱宇阳1 小时前
Linux 安全加固:设置命令行无操作超时退出
linux·运维·安全
呆萌小新@渊洁1 小时前
声纹模型全流程实践-开发(训练 - 微调 - 部署 - 调用)
linux·服务器·python·语音识别
RisunJan1 小时前
Linux命令-getenforce命令(快速检查 Linux 系统中 SELinux 的当前运行模式)
linux·运维·服务器
SMF19191 小时前
解决在 Linux 系统中,当你尝试以 root 用户登录时遇到 “Access denied“ 的错误
java·linux·服务器
qq_479875432 小时前
systemd-resolved.service实验实战3
linux·服务器·c++
森焱森2 小时前
GD32F4 DSP
linux·c语言·arm开发·驱动开发·嵌入式硬件
天天进步20153 小时前
CentOS 实战:如何查看和分析信号量 (Semaphore) 的值
linux·运维·centos
Tisfy3 小时前
LeetCode 3433.统计用户被提及情况:(大)模拟
linux·算法·leetcode