Spark on Yarn安装部署

Spark on Yarn安装部署

(1)上传并解压

复制代码
tar -zxvf spark-3.1.1-bin-hadoop3.2.tgz -C /opt/module/

(2)环境变量

复制代码
vim /etc/profile.d/my_env.sh

export SPARK_HOME=/opt/module/spark-3.1.1-bin-hadoop3.2
export PATH=$SPARK_HOME/bin:$PATH

source /etc/profile

验证成功

复制代码
 spark-submit --version

(3)修改hadoop配置文件yarn-site.xml

复制代码
vim /opt/module/hadoop-3.1.4/etc/hadoop/yarn-site.xml

<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认是true -->
<property>
<name>yarn.nodemanager.pmem-check-enabled</name>
<value>false</value>
</property>
<!--任务每使用1MB物理内存,最多可使用虚拟内存量,默认2.1-->
<property>
<name>yarn.nodemanager.vmem-pmem-ratio</name>
<value>4</value>
</property>

分发

复制代码
scp -r /opt/module/hadoop-3.1.4/etc/hadoop/yarn-site.xml slave1:/opt/module/hadoop-3.1.4/etc/hadoop/
scp -r /opt/module/hadoop-3.1.4/etc/hadoop/yarn-site.xml slave2:/opt/module/hadoop-3.1.4/etc/hadoop/

重启yarn

(4)修改spark-env.sh

备份,复制一份文件改名。

复制代码
cp spark-env.sh.template spark-env.sh
复制代码
export JAVA_HOME=/opt/module/jdk1.8.0_161
export YARN_CONF_DIR=/opt/module/hadoop-3.1.4/etc/hadoop
export HADOOP_CONF_DIR=/opt/module/hadoop-3.1.4/etc/hadoop
复制代码
spark-submit --class org.apache.spark.examples.SparkPi --master yarn ./examples/jars/spark-examples_2.12-3.1.1.jar 10

安装成功

相关推荐
电气铺二表姐137744166155 小时前
微电网管理系统:赋能分布式能源高效运行,筑牢园区/工业能源安全防线
分布式·能源
回家路上绕了弯5 小时前
分布式系统设计:中心化与去中心化思想的碰撞与融合
分布式·后端
yeshihouhou5 小时前
redis实现分布式锁
redis·分布式·junit
AI营销资讯站5 小时前
2025社群运营AI工具TOP榜:从自动化话术到AI CRM系统的终极演进
大数据·人工智能
小小王app小程序开发5 小时前
任务悬赏小程序核心玩法 + 功能全解析:精准匹配与信任构建的变现逻辑
大数据·小程序
vivo互联网技术6 小时前
vivo Celeborn PB级Shuffle优化处理实践
大数据·rss·celeborn·shuffle
song5016 小时前
鸿蒙 Flutter 语音交互进阶:TTS/STT 全离线部署与多语言适配
分布式·flutter·百度·华为·重构·electron·交互
真实的菜6 小时前
TDengine实战:构建高性能物联网时序数据存储方案
大数据·物联网·tdengine
Mxsoft6196 小时前
我发现OPC UA证书失效致连接中断,手动更新救场!
大数据