HDFS文件删除后,HIVE元数据还存在的问题

一.背景

手动在hdfs上删除了一个表的分区数据(inc_day=2023-08-30),当查询这个表这个分区的数据时报错文件不存在

二.原因

即HDFS数据删除了,但是hive metastore元数据却没有更新,使用show partitions tablename 发现该分区还存在

三.解决办法

  • 查阅资料发现hive的msck命令只能修复新增的分区

    msck repair table tablename;

  • 可以使用以下命令解决

    alter table tableneme drop partition(inc_day='2023-08-30')
    对应有条件清理对应分区的,可以使用规则判断,或者正则
    alter table tableneme partition(inc_day < '2023-08-30')

相关推荐
珹洺2 小时前
Java-servlet(完结篇)过滤器乱码解决与监听器
java·运维·服务器·hive·servlet·jsp
朱阿朱16 小时前
大数据Hadoop(MapReduce)
大数据·hadoop·mapreduce
sunxunyong17 小时前
hive/doris查询表的创建和更新时间
数据仓库·hive·hadoop
明月与玄武21 小时前
构建高可用大数据平台:Hadoop与Spark分布式集群搭建指南
hadoop·分布式·spark·大数据测试
小钻风33661 天前
JavaWeb注解的原理
数据仓库·hive·hadoop
CXH7281 天前
hadoop伪分布式部署
大数据·hadoop·分布式
程序员老周6662 天前
从MySQL快速上手大数据Hive
大数据·数据库·hive·hadoop·mysql·mapreduce·数据工程师
lqlj22332 天前
Hadoop案例——流量统计
大数据·hadoop·分布式
IT成长日记2 天前
【Hadoop入门】Hadoop生态之Hive简介
大数据·hive·hadoop
刘翔在线犯法2 天前
Hadoop的序列化和反序列化
大数据·hadoop·分布式