spark 3.0.0源码环境搭建

申尧强2024-07-30 16:56

环境

Spark版本：3.0.0

java版本：1.8

scala版本：2.12.19

Maven版本：3.8.1

将spark-3.0.0的源码导入到idea中

执行mvn clean package -Phive -Phive-thriftserver -Pyarn -DskipTests

执行sparksql示例类SparkSQLExample

运行成功

parse包的类是ANTLR工具生成的，确认idea的插件已经安装了。

找到sql包下面的SqlBase.g4文件，右键执行生成文件。最后生成的文件在gen目录下，创建一个新的包org.apache.spark.sql.catalyst.parser，将生成的文件都复制到这个包下面。

在spark-example模块的依赖加上scala-reflect的jar包

在运行界面上，选中'将带有provided依赖加入路径'

spark版本文件是spark-build-info.sh文件生成的

我们可以手动在创建spark-version-info.properties文件，写上版本

代码中加上master的配置

在对应plugin中找到插件主页。

在主页中找到对应版本的插件下载

手动安装下载的插件