hive如何新增分区

hive新增分区有如下几种常见

场景一:insert或load数据时

insert

bash 复制代码
insert overwrite table mytable partition (dt='20150617') select ....

load:

bash 复制代码
LOAD DATA [LOCAL] INPATH 'hdfs://source_path' INTO TABLE table_name PARTITION (partition_column='value');

场景二:单独的某个分区执行add

bash 复制代码
ALTER TABLE table_name ADD PARTITION (partition_column='value') LOCATION 'hdfs://path/to/partition';

location可以不带,默认改路径在表数据路径下,但是注意ADD PARTITION不会去直接操作对应的数据路径,和msck的时候一样,对于需要追加的新分区只操作元数据的新增,当你插入分区数据的时候路径会生成

相关推荐
ha_lydms9 分钟前
AnalyticDB导入MaxCompute数据的几种方式
大数据·数据仓库·阿里云·dataworks·maxcompute·odps·analyticdb
ha_lydms3 小时前
2、Spark 函数_a/b/c
大数据·c语言·hive·spark·时序数据库·dataworks·数据开发
是阿威啊1 天前
【第二站】本地hadoop集群配置yarn模式
大数据·linux·hadoop·yarn
好大哥呀1 天前
Hadoop yarn
大数据·hadoop·分布式
红队it1 天前
【数据分析】基于Spark链家网租房数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅
java·数据库·hadoop·分布式·python·数据分析·spark
本旺2 天前
【数据开发离谱场景记录】Hive + ES 复杂查询场景处理
hive·hadoop·elasticsearch
莫叫石榴姐2 天前
Doris为2.1版本,但json_each不可以用解决方法
数据仓库·json
无泪无花月隐星沉2 天前
uos server 1070e部署Hadoop
大数据·运维·服务器·hadoop·分布式·uos·国产化os
悟能不能悟3 天前
springboot全局异常
大数据·hive·spring boot
是阿威啊3 天前
【第一站】本地虚拟机部署Hadoop分布式集群
大数据·linux·hadoop·分布式