课堂总结。

Apache Hive 是 Hadoop 上的 SQL 引擎,Spark SQL 编译时可以包含 Hive 支持,也可以不包含。包含 Hive 支持的 Spark SQL 可以支持 Hive 表访问、UDF (用户自定义函数)、Hive 查询语言(HQL)等。需要强调的一点是,如果要在 Spark SQL 中包含Hive 的库,并不需要事先安装 Hive。一般来说,最好还是在编译 Spark SQL 时引入 Hive支持,这样就可以使用这些特性了。

使用方式分为内嵌Hive、外部Hive、Spark-SQL CLI、Spark beeline 以及代码操作。

1)内嵌的 HIVE

2)外部的 HIVE

在虚拟机中下载以下配置文件:

如果想在spark-shell中连接外部已经部署好的 Hive,需要通过以下几个步骤:

➢ Spark 要接管 Hive 需要把 hive-site.xml 拷贝到 conf/目录下,并将url中的localhost改为node01

相关推荐
留思难2 天前
Pyhton生活手册-NumPy数据类型:从快递单到智能家居的数据变形术
numpy
留思难7 天前
Python生活手册-Numpy数组索引:从快递柜到咖啡店的数字化生活指南
python·numpy
Code_流苏7 天前
《Python星球日记》 第36天:线性代数基础
线性代数·numpy·数据科学·向量空间·矩阵运算
留思难8 天前
Python生活手册-NumPy数组创建:从快递分拣到智能家居的数据容器
python·numpy
xiaohanbao098 天前
day16 numpy和shap深入理解
python·学习·机器学习·信息可视化·numpy·pandas
engchina10 天前
如何在Dify沙盒中安装运行pandas、numpy
numpy·pandas·dify·代码节点
Alonelies12 天前
第二章-科学计算库NumPy
numpy
晨曦54321015 天前
Numpy数组与矩阵——python学习
python·矩阵·numpy
guest_88117 天前
用 Python 打造打篮球字符动画!控制台彩色炫酷输出,抖音搞怪视频灵感还原
开发语言·python·numpy·pillow
CH3_CH2_CHO18 天前
不吃【Numpy】版
开发语言·python·numpy