9_Spark安装

下载spark压缩包

通过百度网盘分享的文件:spark-2.0.2-bin-hadoop2.6.tgz

链接:https://pan.baidu.com/s/1lXPExVxxdkdx1QjiLlaorw

提取码:yc69

通过百度网盘分享的文件:scala-2.11.8.tgz

链接:https://pan.baidu.com/s/1YR4enZqTgE-Yy3Jb456JIQ

提取码:yc69

1.Scala配置
  • 分别在master、slave1、slave2上执行。

解压Scala压缩包,进入解压后的Scala目录

pwd

vim /root/.bashrc

添加环境变量:

text 复制代码
#set scala environment
export SCALA_HOME=/usr/local/src/scala-2.11.8
export PATH=$PATH:${SCALA_HOME}/bin
#set spark environment
export SPARK_HOME=/usr/local/src/spark-2.0.2-bin-hadoop2.6
export PATH=$PATH:${SPARK_HOME}/bin

验证:

bash
scala -version
2.Spark集群配置

解压Spark压缩包

进入解压后的Spark目录

cd conf/

添加和修改slaves文件
cp slaves.template slaves
vim slaves
# 将 localhost 修改为:
slave1
slave2
添加和修改 spark-env.sh 文件
cp spark-env.sh.template spark-env.sh
vim spark-env.sh

添加配置:

text 复制代码
export SCALA_HOME=/usr/local/src/scala-2.11.8
export JAVA_HOME=/usr/local/src/jdk1.8.0_181
export HADOOP_HOME=/usr/local/src/hadoop-2.6.1
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
SPARK_MASTER_WEBUI_PORT=8989
SPARK_MASTER_IP=master
SPARK_LOCAL_DIRS=/usr/local/src/spark-2.0.2-bin-hadoop2.6
SPARK_DRIVER_MEMORY=1G
分发Spark到slave节点
# 进入 /usr/local/src 目录
scp -rp spark-2.0.2-bin-hadoop2.6/ slave1:`pwd`
scp -rp spark-2.0.2-bin-hadoop2.6/ slave2:`pwd`
3.启动集群
cd sbin/
./start-all.sh
jps
4.网页监控面板

master:8989

5.验证

进入Spark目录

# 集群 Standalone
./bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://master:7077 ./examples/jars/spark-examples_2.11-2.0.2.jar 10
# 集群 spark on Yarn
./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster ./examples/jars/spark-examples_2.11-2.0.2.jar 10

相关推荐
kngines29 分钟前
【实战ES】实战 Elasticsearch:快速上手与深度实践-3.2.3 案例:新闻搜索引擎的相关性优化
大数据·elasticsearch·搜索引擎
秦南北1 小时前
国内领先的宠物类电商代运营公司品融电商
大数据·人工智能·电商
problc3 小时前
Manus AI 全球首款通用型 Agent,中国制造
大数据·人工智能·制造
Demons_kirit3 小时前
Dubbo+Zookeeper
分布式·zookeeper·dubbo
码农liuxin5 小时前
Dubbo 与 Eureka 深度对比:服务通信与发现的核心差异与选型指南
分布式·后端·dubbo
*星星之火*6 小时前
【Flink银行反欺诈系统设计方案】3.欺诈的7种场景和架构方案、核心表设计
大数据·架构·flink
黑客KKKing6 小时前
Refreshtoken 前端 安全 前端安全方面
大数据·前端·网络·安全·web安全
永洪科技6 小时前
共绘智慧升级,看永洪科技助力由由集团起航智慧征途
大数据·数据分析·数据可视化·bi
好记性+烂笔头6 小时前
Hadoop八股
大数据·hadoop·分布式
Python数据分析与机器学习6 小时前
《基于Hadoop的出租车需求预测系统设计与实现》开题报告
大数据·hadoop·分布式·python·算法·数据挖掘·数据分析