二百四十二、Hive——Hive的动态分区表出现day=__HIVE_DEFAULT_PARTITION__分区

一、目的

Hive的DWD层动态分区表的分区出现day=HIVE_DEFAULT_PARTITION,有点懵,而且表中数据的day字段也显示__HIVE_DEFAULT_PARTITION__

1、DWD层动态分区表的分区 HIVE_DEFAULT_PARTITION

2、DWD层分区字段day数据 HIVE_DEFAULT_PARTITION

二、分析原因

找了篇博客,发现原来是我插入数据指定分区日期这一天却没有数据,所以才会显示分区字段day的数据为__HIVE_DEFAULT_PARTITION__

用博客里的话说,Hive对于指定的分区键如果存在空值时,会对空值部分创建一个默认分区用于存储该部分数据,默认该分区名为_HIVE_DEFAULT_PARTITION

1、插入的数据,数据日期都不是2024-06-27

2、但是动态SQL里,指定的分区是2024-06-27

3、博客链接

http://t.csdnimg.cn/xxW7g

4、博客截图

三、解决方法

直接删掉__HIVE_DEFAULT_PARTITION__分区即可

复制代码
alter table hurys_dc_dwd.dwd_json_turnratio drop partition (day='__HIVE_DEFAULT_PARTITION__');

问题解决!

相关推荐
isfox13 小时前
Google GFS 深度解析:分布式文件系统的开山之作
大数据·hadoop
鼠鼠我捏,要死了捏15 小时前
Hadoop NameNode内存泄漏与GC停顿问题排查与解决方案
hadoop·问题排查·jvm优化
嘉禾望岗50318 小时前
Yarn介绍与HA搭建
大数据·hadoop·yarn
IT研究室19 小时前
大数据毕业设计选题推荐-基于大数据的国家药品采集药品数据可视化分析系统-Spark-Hadoop-Bigdata
大数据·hadoop·信息可视化·spark·毕业设计·数据可视化·bigdata
Lx35219 小时前
Hadoop性能瓶颈分析:从JVM到磁盘IO的全链路优化
大数据·hadoop
DashingGuy20 小时前
数仓建模理论
数据仓库
BYSJMG1 天前
计算机毕业设计选题:基于Spark+Hadoop的健康饮食营养数据分析系统【源码+文档+调试】
大数据·vue.js·hadoop·分布式·spark·django·课程设计
励志成为糕手1 天前
Hadoop进程:深入理解分布式计算引擎的核心机制
大数据·hadoop·分布式·mapreduce·yarn
像豆芽一样优秀1 天前
Hive和Flink数据倾斜问题
大数据·数据仓库·hive·hadoop·flink
计算机毕业设计木哥1 天前
计算机毕业设计 基于Python+Django的医疗数据分析系统
开发语言·hadoop·后端·python·spark·django·课程设计