hive动态分区

hive动态分区概念:允许插入数据到分区表时,根据插入的数据内容自动创建相应的分区

1.启用动态分区功能

hive.exec.dynamic.partition=true;

2.分区字段设置

在insert语句中, 动态分区的字段必须放在select语句的末尾,hive会根据这个字段的值来创建分区目录

示例:

sql 复制代码
--创建分区表:
create table test (
id string
,name string
)
partitioned by (dt string)
row format delimited
fields terminated by '|'
lines terminated by '\n'
;

--动态插入数据:
set hive.exec.dynamic.partition=true;
insert into test
select '1' as id, 'one' as name, '20200921' as dt
union all
select '2' as id, 'two' as name, '20200922' as dt
union all
select '3' as id, 'three' as name, '20200923' as dt

--查看最终效果:
select * from test;
+----------+------------+-----------+
| test.id  | test.name  |  test.dt  |
+----------+------------+-----------+
| 1        | one        | 20200921  |
| 2        | two        | 20200922  |
| 3        | three      | 20200923  |
+----------+------------+-----------+
3 rows selected (0.618 seconds)

show partitions test;
+--------------+
|  partition   |
+--------------+
| dt=20200921  |
| dt=20200922  |
| dt=20200923  |
+--------------+
3 rows selected (0.436 seconds)
相关推荐
杰克逊的日记9 小时前
Hive的安装与部署
数据仓库·hive·hadoop
想做富婆9 小时前
Hive关于数据库的语法,warehouse,metastore
数据仓库·hive·hadoop
STONE_KKK9 小时前
Hive详细讲解-基础语法快速入门
数据仓库·hive·hadoop
秉寒-CHO13 小时前
探秘数据仓库新势力:网络建模
数据仓库
weixin_3077791314 小时前
C++和Python实现SQL Server数据库导出数据到S3并导入Redshift数据仓库
数据库·c++·数据仓库·python·sqlserver
kcarly15 小时前
数据库、数据仓库、数据湖有什么不同
数据库·数据仓库
秉寒-CHO19 小时前
认知计算与 AI 大模型:数据仓库、数据湖与数据分析的变革力量
数据仓库·人工智能·数据分析
STONE_KKK20 小时前
Hive详细讲解-概述与环境搭建
hive·hadoop·硬件架构
SelectDB技术团队1 天前
Apache Doris 2.1.8 版本正式发布
大数据·数据库·数据仓库·数据分析·doris
狮歌~资深攻城狮1 天前
什么时候用MPP,什么时候用TiDB?
数据库·数据仓库·分布式·数据分析·tidb