Linux操作系统:Spark在虚拟环境下的安装及部署

将Spark安装到指定目录

复制代码
// 通过wget下载Spark安装包
$ wget https://d3kbcqa49mib13.cloudfront.net/spark-2.1.1-bin-hadoop2.7.tgz 
// 将spark解压到安装目录
$ tar --zxvf spark-2.1.1-bin-hadoop2.7.tgz --C /usr/local/
// 重命名
$ mv /usr/local/spark-2.1.1-bin-hadoop2.7 /usr/local/spark

设置Spark配置文件

修改 slave 配置文件

复制代码
$ vim /usr/local/conf/slaves

localhost # 在文件最后将本机主机名将那些添加

修改 Spark-Env 配置文件

复制代码
$ cd /usr/local/spark
$ cp ./conf/spark-env.sh.template ./conf/spark-env.sh 
$ vim ./conf/spark-env.sh
SPARK_MASTER_HOST=localhost       #添加spark master的主机名
SPARK_MASTER_PORT=7077        #添加spark master的端口号
export JAVA_HOME=/usr/local/java/jdk1.8.0_162           #添加javahome

如果没有JDK可以安装JDK!!!

启动和关闭Spark服务

启动Spark集群

复制代码
$ cd /usr/local/spark
$ ./sbin/start-all.sh

// 访问Spark 集群,浏览器访问 http://localhost:8080

关闭 Spark 集群

复制代码
$ cd /usr/local/spark
$ ./sbin/stop-all.sh
相关推荐
肌肉娃子11 小时前
20260227.spark.Spark 性能刺客:千万别在 for 循环里写 withColumn
spark
Rockbean15 小时前
用40行代码搭建自己的无服务器OCR
服务器·python·deepseek
茶杯梦轩18 小时前
CompletableFuture 在 项目实战 中 创建异步任务 的核心优势及使用场景
服务器·后端·面试
崔小汤呀19 小时前
最全的docker安装笔记,包含CentOS和Ubuntu
linux·后端
何中应19 小时前
vi编辑器使用
linux·后端·操作系统
何中应19 小时前
Linux进程无法被kill
linux·后端·操作系统
何中应19 小时前
rm-rf /命令操作介绍
linux·后端·操作系统
何中应19 小时前
Linux常用命令
linux·操作系统
葛立国19 小时前
从 / 和 /dev 说起:Linux 文件系统与挂载点一文理清
linux
海天鹰1 天前
【免费】PHP主机=域名+解析+主机
服务器