hive中with as用法及注意事项

一、with...as语句说明

wih语句,允许hive定义一个sql片段,供整个sql使用,会将这个片段产生的结果集保存在内存中,后续的sql均可以访问这个结果集,作用与视图或临时表类似。

【注】目前 oracle、sql server、hive等均支持 with as 用法,但 mysql并不支持!

二、注意事项

1、with 语句是一次性的,相当于建立了一张临时虚拟表,但不会被物理创建,用完即销毁

2、每一个with语句,单独成为一个子模块,最后使用基础表将它们串联起来。这里必须要整体作为一条sql查询,即with as语句后不能加分号,不然会报错

3、with as允许跟多个子句,用逗号隔开,最后一个子句与后面的查询语句之间只能用右括号分隔,不能用逗号

sql 复制代码
create table a as
with t1 as (select * from firstTable),
t2 as (select * from secondTable),
t3 as (select * from thirdTable)
select * from t1,t2,t3;

4、with...as语句必须和其他sql一起使用,如果定义了wih子句,但其后没有跟selec查询,则会报错

sql 复制代码
with t1 as (select * from table1)   -- 该语句执行会报错

-- 正确写法:(没有使用 t1没关系,其后有select就行)
with t1 as (select * from table1)
select * from table1

5、前面的with子句定义的查询在后面的with子句中可以使用。但是一个with子句内部不能嵌套with子句

sql 复制代码
with t1 as (select * from table1),
t2 as (select t1.id from t1)
select * from t2

6、with不适合过大的表,会落盘,频繁shuffle ,过大时直接落表更好。

7、with as 是提高了可读性,可若是后面多次利用这个片段,那完整的SQL就会异常庞大,放在大数据Hive中,job数量甚至会翻几倍,这也是一个坑,所以适用情况得看自己权衡。

相关推荐
且去填词1 天前
DeepSeek :基于 Schema 推理与自愈机制的智能 ETL
数据仓库·人工智能·python·语言模型·etl·schema·deepseek
yumgpkpm2 天前
Cloudera CDH、CDP、Hadoop大数据+决策模型及其案例
大数据·hive·hadoop·分布式·spark·kafka·cloudera
小湘西2 天前
数仓分层架构详解2:ODS、DWD、DWS
大数据·数据库·数据仓库
小湘西2 天前
数仓分层架构详解:ODS、DWD、DWS
数据仓库·数据分析
鲨莎分不晴2 天前
大数据的“数字金库”:HDFS 核心原理与操作指令全解
大数据·hadoop·hdfs
鲨莎分不晴2 天前
给 Hadoop 插上 SQL 的翅膀:Apache Hive 架构与实战全解
hadoop·sql·apache
德彪稳坐倒骑驴2 天前
Hive电商数据分析项目 过程记录
hive·hadoop·数据分析
红队it2 天前
【Spark+Hadoop】基于spark+hadoop游戏评论数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅
大数据·hadoop·分布式·算法·游戏·数据分析·spark
yumgpkpm2 天前
华为 GaussDB 商业版(本地部署)部署方案及相关步骤
hive·hadoop·redis·elasticsearch·华为·kafka·gaussdb
独自归家的兔2 天前
Ambari与Bigtop深度解析:大数据集群管理与生态标准化利器
大数据·hadoop·ambari