如何搭建Spark YARN模式的集群

如何搭建Spark YARN模式的集群

  • 节点规划:1个主节点(Master)+ N个工作节点(Worker),需安装Java、Hadoop、Spark。

  • 配置YARN:修改Hadoop的 yarn-site.xml ,启用ResourceManager和NodeManager。

Spark配置

  1. 修改Spark参数
  • 编辑 conf/spark-env.sh ,添加:

export HADOOP_CONF_DIR=/path/to/hadoop/conf

export SPARK_MASTER_IP=主节点IP

  1. 配置 slaves 文件
  • 在 conf/slaves 中列出所有Worker节点IP(每行一个)。

启动集群

  1. 启动Hadoop:

start-dfs.sh # 启动HDFS

start-yarn.sh # 启动YARN

  1. 启动Spark集群:

./sbin/start-all.sh # 在主节点执行

验证

  • 访问YARN界面(默认端口8088),查看Spark应用队列。

  • 提交测试任务:

spark-submit --master yarn --class org.apache.spark.examples.SparkPi /path/to/spark-examples.jar 10

相关推荐
wyjcxyyy8 分钟前
打靶日记-RCE-labs(续)
linux·运维·服务器
Ray Song20 分钟前
Linux iptables防火墙操作
linux·网络·iptables·防火墙
is08151 小时前
linux 启动流程?
linux
六点半8881 小时前
【Linux】Linux编译器-gcc/g++使用
linux·运维·服务器
穷人小水滴1 小时前
Android 运行 deno 的新方法 (3): Termux 胖喵安初
android·linux
muzi_liii1 小时前
Linux权限
linux
杜子不疼.1 小时前
《从 Vim 新手到“键圣”:我的手指进化史》
linux·编辑器·vim
我才是一卓1 小时前
排查解决 nvidia-suspend 导致的 linux 系统无响应/死机问题
linux·运维·服务器
穷人小水滴1 小时前
7 天充电宝计划 (小实验)
android·linux
FJW0208141 小时前
Mysql集成技术
linux·mysql·云原生