SparkSQL源码分析系列02-编译环境准备

Empty-cup2023-08-24 8:23

本文主要描述一些阅读Spark源码环境的准备工作，会涉及到源码编译，插件安装等。

打开IDEA，在Git下的Clone中，输入 https://github.com/apache/spark ，克隆代码到本地，CheckOut到目标版本Spark3.4

版本按照pom文件指定的版本安装，在IDEA中配置安装的路径。

在Spark源码项目中，搜索 SqlBaseParser.g4 文件，在 singleStatement 上右键，找到"Test Rule singleStatement"，在底部对话框中输入SQL语句，观察解析出的抽象语法树。

注意：SQL语句一定要大写。

由于我们只做源码阅读，不做打包，所以只需要通过 compile 就行，package貌似报错更多，不容易打包成功，但是 compile 相对容易。多次 compile 尝试，直到 build success。

在.../spark_branch3_4/sql/core/src/test/scala/org/apache/spark/sql目录下，打开 SQLQuerySuite 文件，在任意一个test模块上右键、运行，观察是否正常输出。