Spark,从0开始配置Spark的local模式

从0开始配置Spark的local模式

具体步骤:

1.启动虚拟机(开一台即可)

2.通过finalshell连接虚拟机,并将文件上传安装文件到 /opt/software下

3.解压spark安装文件到/opt/module下
tar -zxvf spark-3.3.1-bin-hadoop3.tgz -C /opt/module/

4.重命名,把解压后的文件夹改成spark-local。因为后续我们还会使用其他的配置方式,所以这里先重命名一次。mv是linux的命令,

mv spark-3.3.1-bin-hadoop3 spark-local
5.配置环境变量
① 打开etc/profile.d/my_env.sh文件中,补充设置spark的环境变量。

复制代码
export SPARK_HOME=/opt/module/spark-local
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

② 使用 source 命令让环境变量生效

root@hadoop100 module\]# cd /etc/profile.d \[root@hadoop100 profile.d\]# source my_env.sh 运行一下下面两行代码 \[root@hadoop100 profile.d\]# cd /opt/module \[root@hadoop100 module\]# spark-submit --version 出现下列就是对的,成功了 ![](https://i-blog.csdnimg.cn/direct/4e478a93f31045c0a268c3dffe29e127.png) ### **现在我们使用单机模式运行第一个Spark程序** 示例: 进入到spark-local,运行命令spark-submit命令。 spark-submit --class org.apache.spark.examples.SparkPi --master local\[2\] /opt/module/spark-local/examples/jars/spark-examples_2.12-3.1.1.jar 10 结果展示: ![](https://i-blog.csdnimg.cn/direct/85e366c664a64434ae201f5ac3d71832.png) 查看运行任务详情 在任务还处于运行状态时,可以通过hadoop100:4040来查看。 ![](https://i-blog.csdnimg.cn/direct/d2f2d03b8cae40b8a572af33ecd6b0ad.png)注:一旦任务结束,则这个界面就不可访问了。

相关推荐
A__tao2 分钟前
Elasticsearch Mapping 一键生成 Proto 文件(支持嵌套 + 注释过滤)
大数据·elasticsearch·jenkins
Gofarlic_OMS1 小时前
装备制造企业Fluent许可证成本分点典型案例
java·大数据·开发语言·人工智能·自动化·制造
程序员雷欧1 小时前
大模型应用开发学习第八天
大数据·人工智能·学习
liukuang1101 小时前
伊利、蒙牛、飞鹤与光明乳业:存量时代的攻守之道与价值分化
大数据·人工智能·物联网
supericeice2 小时前
创邻科技 AI智算一体机:支持 DeepSeek 671B 与 Qwen3 单机部署,覆盖纯CPU到多GPU多机扩展
大数据·人工智能·科技
智慧景区与市集主理人2 小时前
巨有科技云票务,破解景区五一运营的入园难“效率瓶颈”
大数据·人工智能·科技
媒介发稿小能手2 小时前
技术视角下的品牌传播范式迁移:当“搜索引擎优化”让位于“媒体收录逻辑”
大数据·搜索引擎·ai·产品运营·媒体
2501_933329552 小时前
企业媒体发布与舆情管理实战:Infoseek舆情系统技术架构与落地解析
大数据·开发语言·人工智能·数据库开发
Are_You_Okkk_3 小时前
AI原生与外挂的区别:开源知识库的优势及优化方向
大数据·人工智能·开源