课堂总结。

Apache Hive 是 Hadoop 上的 SQL 引擎,Spark SQL 编译时可以包含 Hive 支持,也可以不包含。包含 Hive 支持的 Spark SQL 可以支持 Hive 表访问、UDF (用户自定义函数)、Hive 查询语言(HQL)等。需要强调的一点是,如果要在 Spark SQL 中包含Hive 的库,并不需要事先安装 Hive。一般来说,最好还是在编译 Spark SQL 时引入 Hive支持,这样就可以使用这些特性了。

使用方式分为内嵌Hive、外部Hive、Spark-SQL CLI、Spark beeline 以及代码操作。

1)内嵌的 HIVE

2)外部的 HIVE

在虚拟机中下载以下配置文件:

如果想在spark-shell中连接外部已经部署好的 Hive,需要通过以下几个步骤:

➢ Spark 要接管 Hive 需要把 hive-site.xml 拷贝到 conf/目录下,并将url中的localhost改为node01

相关推荐
jerryinwuhan16 小时前
python数据挖掘基础
python·数据挖掘·numpy
SugarFreeOixi2 天前
MATLAB绘图风格记录NP类型
python·matlab·numpy
小陈工2 天前
FastAPI性能优化实战:从每秒100请求到1000的踩坑记录
python·性能优化·django·flask·numpy·pandas·fastapi
REDcker3 天前
CentOS 与主流 Linux 发行版历史与版本综述
linux·centos·numpy
百年੭ ᐕ)੭*⁾⁾4 天前
DataFrame存入mysql以及读取操作
数据库·mysql·numpy·pandas·ipython
TheLegendMe6 天前
NumPy 矩阵操作 + 图像处理
图像处理·矩阵·numpy
李昊哲小课6 天前
NumPy轴方向统计在多维数据分析中的应用
python·数据分析·numpy
李昊哲小课7 天前
NumPy 完整学习笔记
笔记·python·学习·数据分析·numpy
好家伙VCC7 天前
**NumPy中的高效数值计算:从基础到进阶的实战指南**在现代数据科学与机器学习领域
java·python·机器学习·numpy
MediaTea7 天前
NumPy:ndarray 数组属性
numpy