hive中with as用法及注意事项

一、with...as语句说明

wih语句,允许hive定义一个sql片段,供整个sql使用,会将这个片段产生的结果集保存在内存中,后续的sql均可以访问这个结果集,作用与视图或临时表类似。

【注】目前 oracle、sql server、hive等均支持 with as 用法,但 mysql并不支持!

二、注意事项

1、with 语句是一次性的,相当于建立了一张临时虚拟表,但不会被物理创建,用完即销毁

2、每一个with语句,单独成为一个子模块,最后使用基础表将它们串联起来。这里必须要整体作为一条sql查询,即with as语句后不能加分号,不然会报错

3、with as允许跟多个子句,用逗号隔开,最后一个子句与后面的查询语句之间只能用右括号分隔,不能用逗号

sql 复制代码
create table a as
with t1 as (select * from firstTable),
t2 as (select * from secondTable),
t3 as (select * from thirdTable)
select * from t1,t2,t3;

4、with...as语句必须和其他sql一起使用,如果定义了wih子句,但其后没有跟selec查询,则会报错

sql 复制代码
with t1 as (select * from table1)   -- 该语句执行会报错

-- 正确写法:(没有使用 t1没关系,其后有select就行)
with t1 as (select * from table1)
select * from table1

5、前面的with子句定义的查询在后面的with子句中可以使用。但是一个with子句内部不能嵌套with子句

sql 复制代码
with t1 as (select * from table1),
t2 as (select t1.id from t1)
select * from t2

6、with不适合过大的表,会落盘,频繁shuffle ,过大时直接落表更好。

7、with as 是提高了可读性,可若是后面多次利用这个片段,那完整的SQL就会异常庞大,放在大数据Hive中,job数量甚至会翻几倍,这也是一个坑,所以适用情况得看自己权衡。

相关推荐
lightningyang3 小时前
Hadoop 分布式集群配置(OpenEuler 1主2)
hadoop·openeuler·天枢一体化虚拟仿真靶场平台
是阿威啊4 小时前
【第六站】测试本地项目连接虚拟机上的大数据集群
大数据·linux·hive·hadoop·spark·yarn
老徐电商数据笔记4 小时前
技术复盘第八篇:从“数据烟囱”到“能力引擎”:中型电商数仓重构实战手册
大数据·数据仓库·重构·数据中台·用户画像·技术面试
青木川崎6 小时前
hive实战
数据仓库·hive·hadoop
是阿威啊6 小时前
【第五站】集群组件一键启动/关闭脚本(Hadoop/YARN + Hive + Spark)
linux·运维·hive·hadoop·spark
青木川崎6 小时前
大数据技术之hive
大数据·hive·hadoop
搬砖快乐~6 小时前
面经:大数据开发岗-初面 面试题(40分钟)
大数据·hadoop·spark·kafka·面试题·面经
是阿威啊6 小时前
【第三站】本地虚拟机部署hive集群
linux·数据仓库·hive·hadoop·分布式
和光同尘20236 小时前
一文讲透CentOS下安装部署使用MYSQL
linux·运维·数据库·数据仓库·mysql·centos·database
qq_2704900967 小时前
基于Hadoop的教育大数据可视化系统的设计与实现
大数据·hadoop·信息可视化