Linux操作系统:Spark在虚拟环境下的安装及部署

将Spark安装到指定目录

// 通过wget下载Spark安装包
$ wget https://d3kbcqa49mib13.cloudfront.net/spark-2.1.1-bin-hadoop2.7.tgz 
// 将spark解压到安装目录
$ tar --zxvf spark-2.1.1-bin-hadoop2.7.tgz --C /usr/local/
// 重命名
$ mv /usr/local/spark-2.1.1-bin-hadoop2.7 /usr/local/spark

设置Spark配置文件

修改 slave 配置文件

$ vim /usr/local/conf/slaves

localhost # 在文件最后将本机主机名将那些添加

修改 Spark-Env 配置文件

$ cd /usr/local/spark
$ cp ./conf/spark-env.sh.template ./conf/spark-env.sh 
$ vim ./conf/spark-env.sh
SPARK_MASTER_HOST=localhost       #添加spark master的主机名
SPARK_MASTER_PORT=7077        #添加spark master的端口号
export JAVA_HOME=/usr/local/java/jdk1.8.0_162           #添加javahome

如果没有JDK可以安装JDK!!!

启动和关闭Spark服务

启动Spark集群

$ cd /usr/local/spark
$ ./sbin/start-all.sh

// 访问Spark 集群,浏览器访问 http://localhost:8080

关闭 Spark 集群

$ cd /usr/local/spark
$ ./sbin/stop-all.sh
相关推荐
钰爱&15 分钟前
【操作系统】Linux之线程同步二(头歌作业)
linux·运维·算法
DC_BLOG2 小时前
Mysql-DDL语句
服务器·数据库·mysql
Yz98763 小时前
Hive基础
大数据·linux·数据仓库·hive·hadoop·bigdata
raysync8883 小时前
镭速大文件传输软件向金融银行的文档管理提供高效的解决方案
服务器·网络·金融
Stara05114 小时前
Linux系统常用操作与命令指南
linux·vim
AI狂热爱好者5 小时前
A3超级计算机虚拟机,为大型语言模型LLM和AIGC提供强大算力支持
服务器·人工智能·ai·gpu算力
white.tie5 小时前
linux配置nginx
linux·运维·nginx
TN_stark9325 小时前
多进程/线程并发服务器
服务器·算法·php
Komorebi.py5 小时前
【Linux】-学习笔记03
linux·笔记·学习
PyAIGCMaster5 小时前
python环境中,敏感数据的存储与读取问题解决方案
服务器·前端·python