Spark,从0开始配置Spark的local模式

从0开始配置Spark的local模式

具体步骤:

1.启动虚拟机(开一台即可)

2.通过finalshell连接虚拟机,并将文件上传安装文件到 /opt/software下

3.解压spark安装文件到/opt/module下
tar -zxvf spark-3.3.1-bin-hadoop3.tgz -C /opt/module/

4.重命名,把解压后的文件夹改成spark-local。因为后续我们还会使用其他的配置方式,所以这里先重命名一次。mv是linux的命令,

mv spark-3.3.1-bin-hadoop3 spark-local
5.配置环境变量
① 打开etc/profile.d/my_env.sh文件中,补充设置spark的环境变量。

复制代码
export SPARK_HOME=/opt/module/spark-local
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

② 使用 source 命令让环境变量生效

root@hadoop100 module\]# cd /etc/profile.d \[root@hadoop100 profile.d\]# source my_env.sh 运行一下下面两行代码 \[root@hadoop100 profile.d\]# cd /opt/module \[root@hadoop100 module\]# spark-submit --version 出现下列就是对的,成功了 ![](https://i-blog.csdnimg.cn/direct/4e478a93f31045c0a268c3dffe29e127.png) ### **现在我们使用单机模式运行第一个Spark程序** 示例: 进入到spark-local,运行命令spark-submit命令。 spark-submit --class org.apache.spark.examples.SparkPi --master local\[2\] /opt/module/spark-local/examples/jars/spark-examples_2.12-3.1.1.jar 10 结果展示: ![](https://i-blog.csdnimg.cn/direct/85e366c664a64434ae201f5ac3d71832.png) 查看运行任务详情 在任务还处于运行状态时,可以通过hadoop100:4040来查看。 ![](https://i-blog.csdnimg.cn/direct/d2f2d03b8cae40b8a572af33ecd6b0ad.png)注:一旦任务结束,则这个界面就不可访问了。

相关推荐
小马爱打代码1 小时前
分布式锁:原理算法和使用建议
分布式·算法
IT学长编程1 小时前
计算机毕业设计 基于EChants的海洋气象数据可视化平台设计与实现 Python 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
大数据·hadoop·python·毕业设计·课程设计·毕业论文·海洋气象数据可视化平台
呆呆小金人1 小时前
SQL入门: HAVING用法全解析
大数据·数据库·数据仓库·sql·数据库开发·etl·etl工程师
Elastic 中国社区官方博客3 小时前
如何减少 Elasticsearch 集群中的分片数量
大数据·数据库·elasticsearch·搜索引擎·全文检索
一叶飘零_sweeeet3 小时前
从 “黑盒“ 到 “透明“:SkyWalking 实战指南 —— 让微服务问题无所遁形
分布式·微服务·skywalking·分布式链路追踪
知识浅谈3 小时前
Elasticsearch 核心知识点全景解读
大数据·elasticsearch·搜索引擎
武子康3 小时前
大数据-120 - Flink滑动窗口(Sliding Window)详解:原理、应用场景与实现示例 基于时间驱动&基于事件驱动
大数据·后端·flink
Hello.Reader3 小时前
Flink 广播状态(Broadcast State)实战从原理到落地
java·大数据·flink
ApacheSeaTunnel4 小时前
从小时级到分钟级:多点DMALL如何用Apache SeaTunnel把数据集成成本砍到1/3?
大数据·开源·数据集成·seatunnel·技术分享
数据要素X4 小时前
寻梦数据空间 | 路径篇:从概念验证到规模运营的“诊-规-建-运”实施指南
大数据·人工智能·数据要素·数据资产·可信数据空间