检查HIVE分区是否连续

检查HIVE分区是否连续

我们经常可能会有这样的诉求,需要对一张目标表进行分区检查,查看是否存在不连续的情况,该诉求频繁且重要,因此以下语句可以实现我们的诉求

场景描述

我们有一张表,表名 t_user_info,分区字段 ds,分区字段数据类型 String,分区数据格式 yyyyMMdd

分区连续性检查语句

sql 复制代码
SELECT  ds
       ,rn
       ,date_sub(ds_format, rn)
FROM
(
    -- 对分区数据进行类型转换
    SELECT  ds
           ,from_unixtime(unix_timestamp(ds, 'yyyyMMdd'), 'yyyy-MM-dd') as ds_format
           ,row_number() over(order by ds asc) rn -- 排序分区,按照ds升序
    FROM
    (
       -- 获取表中的所有分区数据 
       SELECT  ds
       FROM t_user_info
       -- 指定分区检查的时间段
       WHERE ds between '20221231' and '20230924'
       group by ds
    ) ds_info
) diff_ds_info
limit 1000
;
相关推荐
不会编程的小孩子3 小时前
SpringMVC的架构有什么优势?——视图与模型(二)
hive·hadoop·架构
书生♡3 小时前
【Hive中常见的优化手段----数据采集!Join 优化!Hive索引!数据倾斜!mapreduce本地模式!map和reduce数量调整!】
hive·hadoop·mapreduce
大数据之家5 小时前
hadoop 3.X 分布式HA集成Kerbos(保姆级教程)
大数据·hadoop·分布式
北_鱼5 小时前
Hadoop 部署
大数据·hadoop·分布式
依邻依伴5 小时前
Hadoop 面试题(八)
大数据·hadoop·分布式
逆风就重开7 小时前
大数据开发需要哪些职场知识
大数据·数据仓库·职场和发展·数据分析·职场发展
大数据之家9 小时前
Apache Ranger 2.4.0 集成hadoop 3.X(Kerbos)
大数据·hadoop·apache
SelectDB技术团队13 小时前
Apache Doris 2.1.4 版本正式发布
大数据·数据仓库·doris·实时分析·湖仓一体
thinktik19 小时前
Hadoop 生态和简介
hadoop·数据分析
Ivanqhz19 小时前
可编程定时计数器8253/8254 - 8253入门
大数据·开发语言·hadoop·后端·golang