hive中with as用法及注意事项

一、with...as语句说明

wih语句,允许hive定义一个sql片段,供整个sql使用,会将这个片段产生的结果集保存在内存中,后续的sql均可以访问这个结果集,作用与视图或临时表类似。

【注】目前 oracle、sql server、hive等均支持 with as 用法,但 mysql并不支持!

二、注意事项

1、with 语句是一次性的,相当于建立了一张临时虚拟表,但不会被物理创建,用完即销毁

2、每一个with语句,单独成为一个子模块,最后使用基础表将它们串联起来。这里必须要整体作为一条sql查询,即with as语句后不能加分号,不然会报错

3、with as允许跟多个子句,用逗号隔开,最后一个子句与后面的查询语句之间只能用右括号分隔,不能用逗号

sql 复制代码
create table a as
with t1 as (select * from firstTable),
t2 as (select * from secondTable),
t3 as (select * from thirdTable)
select * from t1,t2,t3;

4、with...as语句必须和其他sql一起使用,如果定义了wih子句,但其后没有跟selec查询,则会报错

sql 复制代码
with t1 as (select * from table1)   -- 该语句执行会报错

-- 正确写法:(没有使用 t1没关系,其后有select就行)
with t1 as (select * from table1)
select * from table1

5、前面的with子句定义的查询在后面的with子句中可以使用。但是一个with子句内部不能嵌套with子句

sql 复制代码
with t1 as (select * from table1),
t2 as (select t1.id from t1)
select * from t2

6、with不适合过大的表,会落盘,频繁shuffle ,过大时直接落表更好。

7、with as 是提高了可读性,可若是后面多次利用这个片段,那完整的SQL就会异常庞大,放在大数据Hive中,job数量甚至会翻几倍,这也是一个坑,所以适用情况得看自己权衡。

相关推荐
larance11 小时前
spark 支持hive
hive·spark
RestCloud11 小时前
实时 vs 批处理:ETL在混合架构下的实践
数据仓库·etl·cdc·数据处理·批处理·数据传输·数据同步
howard200511 小时前
7.1 Hive内置函数
hive·内置函数
larance12 小时前
HIVE 基础
数据仓库·hive·hadoop
wei_shuo13 小时前
openEuler 25.09 实操指南:飞腾 arm64 服务器的 C 程序开发与 Hadoop 伪集群部署及性能测试
hadoop·openeuler
跟着珅聪学java1 天前
Logback日志配置教程
数据仓库·hive·hadoop
yumgpkpm1 天前
腾讯TBDS和CMP(Cloud Data AI Platform,类Cloudera CDP,如华为鲲鹏 ARM 版)比较的缺陷在哪里?
hive·hadoop·elasticsearch·zookeeper·oracle·kafka·hbase
Aevget1 天前
界面控件DevExpress WPF中文教程:Data Grid - 虚拟源限制
hadoop·wpf·界面控件·devexpress·ui开发
SelectDB技术团队1 天前
Apache Doris 在小米统一 OLAP 和湖仓一体的实践
数据仓库·数据分析·apache·数据库开发