Spark on Yarn安装部署

Spark on Yarn安装部署

(1)上传并解压

复制代码
tar -zxvf spark-3.1.1-bin-hadoop3.2.tgz -C /opt/module/

(2)环境变量

复制代码
vim /etc/profile.d/my_env.sh

export SPARK_HOME=/opt/module/spark-3.1.1-bin-hadoop3.2
export PATH=$SPARK_HOME/bin:$PATH

source /etc/profile

验证成功

复制代码
 spark-submit --version

(3)修改hadoop配置文件yarn-site.xml

复制代码
vim /opt/module/hadoop-3.1.4/etc/hadoop/yarn-site.xml

<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认是true -->
<property>
<name>yarn.nodemanager.pmem-check-enabled</name>
<value>false</value>
</property>
<!--任务每使用1MB物理内存,最多可使用虚拟内存量,默认2.1-->
<property>
<name>yarn.nodemanager.vmem-pmem-ratio</name>
<value>4</value>
</property>

分发

复制代码
scp -r /opt/module/hadoop-3.1.4/etc/hadoop/yarn-site.xml slave1:/opt/module/hadoop-3.1.4/etc/hadoop/
scp -r /opt/module/hadoop-3.1.4/etc/hadoop/yarn-site.xml slave2:/opt/module/hadoop-3.1.4/etc/hadoop/

重启yarn

(4)修改spark-env.sh

备份,复制一份文件改名。

复制代码
cp spark-env.sh.template spark-env.sh
复制代码
export JAVA_HOME=/opt/module/jdk1.8.0_161
export YARN_CONF_DIR=/opt/module/hadoop-3.1.4/etc/hadoop
export HADOOP_CONF_DIR=/opt/module/hadoop-3.1.4/etc/hadoop
复制代码
spark-submit --class org.apache.spark.examples.SparkPi --master yarn ./examples/jars/spark-examples_2.12-3.1.1.jar 10

安装成功

相关推荐
商业模式源码开发5 小时前
实体门店低获客成本增长案例:3 人转介绍模型 + 消费返还机制落地分析
大数据·商业模式·私域流量
元拓数智6 小时前
智能分析落地卡壳?先补好「数据关系+语义治理」这层技术基建
大数据·分布式·ai·spark·数据关系·语义治理
TDengine (老段)7 小时前
TDengine Tag 设计哲学与 Schema 变更机制
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
sxgzzn8 小时前
新能源场站数智化转型:基于数字孪生与AI的智慧运维管理平台解析
大数据·运维·人工智能
清平乐的技术专栏9 小时前
【Flink学习】(二)Flink 本地环境搭建,运行第一个入门程序
大数据·flink
这是程序猿9 小时前
Spring Boot自动配置详解
java·大数据·前端
ws2019079 小时前
AUTO TECH China 2026广州汽车零部件展:从整机集成迈向核心部件的产业跃升
大数据·人工智能·科技·汽车
humors2219 小时前
从数据到决策:汽车使用成本的精细计算指南
大数据·程序人生
大大大大晴天10 小时前
Flink技术实践:RocksDB 状态后端技术解密
大数据·flink
1892280486111 小时前
NY382固态MT29F32T08GSLBHL8-24QM:B
大数据·服务器·人工智能·科技·缓存