SparkSQL源码分析系列02-编译环境准备

本文主要描述一些阅读Spark源码环境的准备工作,会涉及到源码编译,插件安装等。

1. 克隆代码。

打开IDEA,在Git下的Clone中,输入 https://github.com/apache/spark ,克隆代码到本地,CheckOut到目标版本Spark3.4

2. 安装maven。

版本按照pom文件指定的版本安装,在IDEA中配置安装的路径。

3. 为IDEA安装 ANTLR 和 Scala 插件
4. 测试ANTLR的词法语法解析功能

在Spark源码项目中,搜索 SqlBaseParser.g4 文件,在 singleStatement 上右键,找到"Test Rule singleStatement",在底部对话框中输入SQL语句,观察解析出的抽象语法树。


注意:SQL语句一定要大写。

5. 编译源码

由于我们只做源码阅读,不做打包,所以只需要通过 compile 就行,package貌似报错更多,不容易打包成功,但是 compile 相对容易。多次 compile 尝试,直到 build success。

6. 运行测试类

在.../spark_branch3_4/sql/core/src/test/scala/org/apache/spark/sql目录下,打开 SQLQuerySuite 文件,在任意一个test模块上右键、运行,观察是否正常输出。

测试案例运行成功。至此,代表源码阅读环境准备完毕。

相关推荐
码界筑梦坊2 小时前
基于Spark的酒店数据分析系统
大数据·分布式·python·信息可视化·spark·毕业设计·个性化推荐
W_chuanqi3 小时前
Windows环境下开发pyspark程序
windows·python·spark·conda
码界筑梦坊5 小时前
基于Spark的招聘数据预测分析推荐系统
大数据·分布式·python·信息可视化·spark·毕业设计
想你依然心痛17 小时前
Spark大数据分析与实战笔记(第四章 Spark SQL结构化数据文件处理-03)
笔记·数据分析·spark
黄雪超21 小时前
核心知识—— RDD常用算子之数据转换
大数据·spark
码界筑梦坊1 天前
基于Spark的抖音数据分析热度预测系统
大数据·信息可视化·数据分析·spark·毕业设计·个性化推荐
Oo_Amy_oO1 天前
Airflow+Spark/Flink vs. Kettle
大数据·flink·spark
今天我又学废了2 天前
Spark,HDFS概述
大数据·hdfs·spark
北随琛烬入2 天前
Spark(10)配置Hadoop集群-集群配置
java·hadoop·spark
IT观察2 天前
Spark 2.0携手Solcore:AI重构去中心化质押算力生态 !
人工智能·重构·spark