如何搭建Spark YARN模式的集群

祈5332025-05-02 8:39

如何搭建Spark YARN模式的集群

节点规划：1个主节点（Master）+ N个工作节点（Worker），需安装Java、Hadoop、Spark。
配置YARN：修改Hadoop的 yarn-site.xml ，启用ResourceManager和NodeManager。

Spark配置

修改Spark参数

编辑 conf/spark-env.sh ，添加：

export HADOOP_CONF_DIR=/path/to/hadoop/conf

export SPARK_MASTER_IP=主节点IP

配置 slaves 文件

在 conf/slaves 中列出所有Worker节点IP（每行一个）。

启动集群

启动Hadoop：

start-dfs.sh # 启动HDFS

start-yarn.sh # 启动YARN

启动Spark集群：

./sbin/start-all.sh # 在主节点执行

验证

访问YARN界面（默认端口8088），查看Spark应用队列。
提交测试任务：

spark-submit --master yarn --class org.apache.spark.examples.SparkPi /path/to/spark-examples.jar 10

上一篇：OpenGL-ES 学习(13) ---- Shader 编译和程序对象

下一篇：设计模式简述（十四）组合模式

热门推荐

01GitHub 镜像站点 02UV安装并设置国内源 03BongoCat - 跨平台键盘猫动画工具 04Linux下V2Ray安装配置指南 05综合整理：pdf预览显示：你尝试预览的文件可能对你的计算机有害。如果你信任此文件以及其来源，请打开此文件以看其内容，如何解决以正常预览文件 06jdk21下载、安装（Windows、Linux、macOS）07安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）08npm使用国内淘宝镜像的方法 09PyCharm 社区版全平台安装指南 10《大数据技术原理与应用》实验报告三熟悉HBase常用操作