Spark on Yarn安装部署

Spark on Yarn安装部署

(1)上传并解压

复制代码
tar -zxvf spark-3.1.1-bin-hadoop3.2.tgz -C /opt/module/

(2)环境变量

复制代码
vim /etc/profile.d/my_env.sh

export SPARK_HOME=/opt/module/spark-3.1.1-bin-hadoop3.2
export PATH=$SPARK_HOME/bin:$PATH

source /etc/profile

验证成功

复制代码
 spark-submit --version

(3)修改hadoop配置文件yarn-site.xml

复制代码
vim /opt/module/hadoop-3.1.4/etc/hadoop/yarn-site.xml

<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认是true -->
<property>
<name>yarn.nodemanager.pmem-check-enabled</name>
<value>false</value>
</property>
<!--任务每使用1MB物理内存,最多可使用虚拟内存量,默认2.1-->
<property>
<name>yarn.nodemanager.vmem-pmem-ratio</name>
<value>4</value>
</property>

分发

复制代码
scp -r /opt/module/hadoop-3.1.4/etc/hadoop/yarn-site.xml slave1:/opt/module/hadoop-3.1.4/etc/hadoop/
scp -r /opt/module/hadoop-3.1.4/etc/hadoop/yarn-site.xml slave2:/opt/module/hadoop-3.1.4/etc/hadoop/

重启yarn

(4)修改spark-env.sh

备份,复制一份文件改名。

复制代码
cp spark-env.sh.template spark-env.sh
复制代码
export JAVA_HOME=/opt/module/jdk1.8.0_161
export YARN_CONF_DIR=/opt/module/hadoop-3.1.4/etc/hadoop
export HADOOP_CONF_DIR=/opt/module/hadoop-3.1.4/etc/hadoop
复制代码
spark-submit --class org.apache.spark.examples.SparkPi --master yarn ./examples/jars/spark-examples_2.12-3.1.1.jar 10

安装成功

相关推荐
辰宇信息咨询2 小时前
3D自动光学检测(AOI)市场调研报告-发展趋势、机遇及竞争分析
大数据·数据分析
珠海西格3 小时前
“主动预防” vs “事后补救”:分布式光伏防逆流技术的代际革命,西格电力给出标准答案
大数据·运维·服务器·分布式·云计算·能源
创客匠人老蒋4 小时前
从数据库到智能体:教育企业如何构建自己的“数字大脑”?
大数据·人工智能·创客匠人
2501_948120154 小时前
基于大数据的泄漏仪设备监控系统
大数据
Spey_Events5 小时前
星箭聚力启盛会,2026第二届商业航天产业发展大会暨商业航天展即将开幕!
大数据·人工智能
AC赳赳老秦5 小时前
专利附图说明:DeepSeek生成的专业技术描述与权利要求书细化
大数据·人工智能·kafka·区块链·数据库开发·数据库架构·deepseek
GeeLark6 小时前
#请输入你的标签内容
大数据·人工智能·自动化
小邓吖6 小时前
自己做了一个工具网站
前端·分布式·后端·中间件·架构·golang
智能相对论6 小时前
2万台?九识无人车车队规模靠谱吗?
大数据
小小王app小程序开发7 小时前
淘宝扭蛋机小程序核心玩法拆解与技术运营分析
大数据·小程序