hive动态分区

hive动态分区概念:允许插入数据到分区表时,根据插入的数据内容自动创建相应的分区

1.启用动态分区功能

hive.exec.dynamic.partition=true;

2.分区字段设置

在insert语句中, 动态分区的字段必须放在select语句的末尾,hive会根据这个字段的值来创建分区目录

示例:

sql 复制代码
--创建分区表:
create table test (
id string
,name string
)
partitioned by (dt string)
row format delimited
fields terminated by '|'
lines terminated by '\n'
;

--动态插入数据:
set hive.exec.dynamic.partition=true;
insert into test
select '1' as id, 'one' as name, '20200921' as dt
union all
select '2' as id, 'two' as name, '20200922' as dt
union all
select '3' as id, 'three' as name, '20200923' as dt

--查看最终效果:
select * from test;
+----------+------------+-----------+
| test.id  | test.name  |  test.dt  |
+----------+------------+-----------+
| 1        | one        | 20200921  |
| 2        | two        | 20200922  |
| 3        | three      | 20200923  |
+----------+------------+-----------+
3 rows selected (0.618 seconds)

show partitions test;
+--------------+
|  partition   |
+--------------+
| dt=20200921  |
| dt=20200922  |
| dt=20200923  |
+--------------+
3 rows selected (0.436 seconds)
相关推荐
红豆和绿豆5 分钟前
实现实时数据仓库开源项目
数据仓库·开源
不剪发的Tony老师8 分钟前
Apache Doris:一款高性能的实时数据仓库
数据库·数据仓库
霍小毛4 小时前
Hive 与 TiDB 在大数据解析场景中的对比分析
大数据·hive·tidb
欧冶渃1 天前
HDFS数据多目录、异构存储、回收站
大数据·hadoop·hdfs
Ray.19982 天前
Flink 中的滚动策略(Rolling Policy)
hive·flink·spark·kafka·big data
开着拖拉机回家2 天前
【Ambari】Ranger KMS
hadoop·ambari·kms·ranger kms
Faith_xzc2 天前
Apache Doris 索引的全面剖析与使用指南
大数据·数据仓库·apache·数据库开发·doris
m0_548049702 天前
基于Hadoop的汽车大数据分析系统设计与实现【爬虫、数据预处理、MapReduce、echarts、Flask】
hadoop·爬虫·汽车
Ray.19982 天前
深入理解 Flink 中的 .name() 和 .uid() 方法
hive·hadoop·flink·spark·kafka
跳跳的向阳花2 天前
02、Hadoop3.x从入门到放弃,第二章:集群环境搭建
hadoop·hdfs·mapreduce·集群·yarn·搭建·3.x