hive如何新增分区

hive新增分区有如下几种常见

场景一:insert或load数据时

insert

bash 复制代码
insert overwrite table mytable partition (dt='20150617') select ....

load:

bash 复制代码
LOAD DATA [LOCAL] INPATH 'hdfs://source_path' INTO TABLE table_name PARTITION (partition_column='value');

场景二:单独的某个分区执行add

bash 复制代码
ALTER TABLE table_name ADD PARTITION (partition_column='value') LOCATION 'hdfs://path/to/partition';

location可以不带,默认改路径在表数据路径下,但是注意ADD PARTITION不会去直接操作对应的数据路径,和msck的时候一样,对于需要追加的新分区只操作元数据的新增,当你插入分区数据的时候路径会生成

相关推荐
君不见,青丝成雪24 分钟前
Hadoop技术栈(四)HIVE常用函数汇总
大数据·数据库·数据仓库·hive·sql
最初的↘那颗心11 小时前
Flink Stream API 源码走读 - print()
java·大数据·hadoop·flink·实时计算
君不见,青丝成雪12 小时前
hadoop技术栈(九)Hbase替代方案
大数据·hadoop·hbase
晴天彩虹雨12 小时前
存算分离与云原生:数据平台的新基石
大数据·hadoop·云原生·spark
yatingliu201913 小时前
HiveQL | 个人学习笔记
hive·笔记·sql·学习
SelectDB技术团队15 小时前
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
数据库·数据仓库·数据分析·apache doris·菜鸟技术
程序员小羊!17 小时前
数据仓库&OLTP&OLAP&维度讲解
数据仓库
最初的↘那颗心18 小时前
Flink Stream API - 源码开发需求描述
java·大数据·hadoop·flink·实时计算
Lx35219 小时前
MapReduce作业调试技巧:从本地测试到集群运行
大数据·hadoop
BYSJMG19 小时前
计算机大数据毕业设计推荐:基于Spark的气候疾病传播可视化分析系统【Hadoop、python、spark】
大数据·hadoop·python·信息可视化·spark·django·课程设计