HDFS文件删除后,HIVE元数据还存在的问题

一.背景

手动在hdfs上删除了一个表的分区数据(inc_day=2023-08-30),当查询这个表这个分区的数据时报错文件不存在

二.原因

即HDFS数据删除了,但是hive metastore元数据却没有更新,使用show partitions tablename 发现该分区还存在

三.解决办法

  • 查阅资料发现hive的msck命令只能修复新增的分区

    msck repair table tablename;

  • 可以使用以下命令解决

    alter table tableneme drop partition(inc_day='2023-08-30')
    对应有条件清理对应分区的,可以使用规则判断,或者正则
    alter table tableneme partition(inc_day < '2023-08-30')

相关推荐
白日与明月12 小时前
Hive分桶机制应用
数据仓库·hive·hadoop
Msshu12313 小时前
XSP25全协议 100W PD快充诱骗芯片_串口读电压电流信息
hive·云计算·json·database·memcached
水火既济__13 小时前
大数据hive_mr压缩问题
大数据·hive·mr
水火既济__13 小时前
hive中加载json数据建表(大规模)
hive·hadoop·json
修先生1 天前
Hive Udf函数AES加密
hive·aes·udf
Volunteer Technology2 天前
HDFS源码(二)
大数据·hadoop·hdfs
WL_Aurora2 天前
MapReduce框架原理深度解析 | Shuffle机制、切片分区、Join全攻略
大数据·hadoop·mapreduce
赵渝强老师2 天前
【赵渝强老师】Hadoop的伪分布部署模式
大数据·hadoop·分布式
Volunteer Technology2 天前
HDFS源码(一)
大数据·hadoop·hdfs
WL_Aurora2 天前
HDFS底层原理深度解析 | 读写流程、NameNode工作机制、DataNode心跳与数据完整性
大数据·hadoop·hdfs