Spark,从0开始配置Spark的local模式

从0开始配置Spark的local模式

具体步骤:

1.启动虚拟机(开一台即可)

2.通过finalshell连接虚拟机,并将文件上传安装文件到 /opt/software下

3.解压spark安装文件到/opt/module下
tar -zxvf spark-3.3.1-bin-hadoop3.tgz -C /opt/module/

4.重命名,把解压后的文件夹改成spark-local。因为后续我们还会使用其他的配置方式,所以这里先重命名一次。mv是linux的命令,

mv spark-3.3.1-bin-hadoop3 spark-local
5.配置环境变量
① 打开etc/profile.d/my_env.sh文件中,补充设置spark的环境变量。

复制代码
export SPARK_HOME=/opt/module/spark-local
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

② 使用 source 命令让环境变量生效

root@hadoop100 module# cd /etc/profile.d
root@hadoop100 profile.d# source my_env.sh

运行一下下面两行代码

root@hadoop100 profile.d# cd /opt/module
root@hadoop100 module# spark-submit --version

出现下列就是对的,成功了

现在我们使用单机模式运行第一个Spark程序

示例:

进入到spark-local,运行命令spark-submit命令。

spark-submit --class org.apache.spark.examples.SparkPi --master local2 /opt/module/spark-local/examples/jars/spark-examples_2.12-3.1.1.jar 10

结果展示:

查看运行任务详情
在任务还处于运行状态时,可以通过hadoop100:4040来查看。

注:一旦任务结束,则这个界面就不可访问了。

相关推荐
皮皮学姐分享-ppx5 小时前
政府绿色采购数据库(2015-2024.3)
大数据·网络·数据库·人工智能·制造
闪电悠米7 小时前
黑马点评-Redis 消息队列-03_stream_consumer_group
开发语言·数据库·redis·分布式·缓存·junit·lua
无忧智库8 小时前
某公共大数据资源中心平台建设项目可行性研究方案(PPT)
大数据
z落落10 小时前
C# 事件(Event)+自定义带参数事件例子
开发语言·分布式·c#
诗词在线10 小时前
求推荐飞花令
大数据·人工智能·python
湘美书院--湘美谈教育11 小时前
湘美谈教育AI系列经验集锦:赋能整理聊斋志异大寓言
大数据·人工智能·深度学习·神经网络·机器学习
jrjrgood11 小时前
现货黄金和黄金期货的区别有哪些?如何投资?
大数据·人工智能·区块链
我是一颗柠檬12 小时前
【Java项目技术亮点】分库分表+数据路由策略:单表5000万后的架构升级方案
java·开发语言·分布式·架构
清辞85312 小时前
Coze从入门到实战---第一、二章
大数据·人工智能·学习·语言模型
TomatoStudy12 小时前
IT职业教育AI落地与实训体系建设复盘——以职坐标模式为例
大数据·人工智能