SQL--查询连续三天登录数据详解

问题: 现有用户登录记录表,请查询出用户连续三天登录的所有数据记录

id           dt

1    2024-04-25 
1    2024-04-26 
1    2024-04-27
1    2024-04-28
1    2024-04-30
1    2024-05-01
1    2024-05-02
1    2024-05-04
1    2024-05-05
2    2024-04-25
2    2024-04-28
2    2024-05-02
2    2024-05-03
2    2024-05-04

期望结果:

先创建表并向hive中插入数据:

create table user_log(
  id int,
  dt string
)
row format delimited
fields terminated by '\t';
load data local inpath '/home/hivedata/1107.txt' into table user_log;

--第一步 找出当前日期的后面的第三个日期(函数lead())和真正的三天后日期 (函数date_add())

lead():是一种窗口函数,用于在基于特定排序规则的结果集中,返回当前行之后的某一行(由用户指定偏移量)的指定列的值

date_add():核心功能是对日期进行加法运算。它接受一个日期值和一个时间间隔作为输入,然后返回在该日期基础上增加指定时间间隔后的日期

sql 复制代码
select *,lead(dt,2) over(partition by id order by dt) late3,date_add(dt,2) true3 from user_log;

查询结果:

--第二步 比较这两个日期是否相等 ,判断当前日期是否是连续三天的

sql 复制代码
with t as (
    select *,lead(dt,2) over(partition by id order by dt) late3,date_add(dt,2) true3 from user_log
)
select *,if(late3 == true3,1,0) from t;

查询结果:

--第三步 筛选出符合条件(连续登陆三天)的起始日期

sql 复制代码
with t as (
    select *,lead(dt,2) over(partition by id order by dt) late3,date_add(dt,2) true3 from user_log
),t1 as (
    select *,if(late3 == true3,1,0) num from t
)
select * from t1 where num=1
;

查询结果:

--第四步 将查询出来的表与另一个一行有三条数据的表进行join

sql 复制代码
with t as (
    select *,lead(dt,2) over(partition by id order by dt) late3,date_add(dt,2) true3 from user_log
),t1 as (
    select *,if(late3 == true3,1,0) num from t
),t2 as (
    select * from t1 where num=1
),t3 as (
    select * from t2,(select explode(`array`(0,1,2)) add_day) a
)
select id,date_add(dt,add_day) `date` from t3 part
;

两表合并后的查询结果:

最终查询结果:

相关推荐
白总Server11 分钟前
UI架构解说
大数据·服务器·网络·数据库·web安全·架构·数据库架构
NY623 分钟前
centos7上安装mysql
数据库·mysql
Bear on Toilet1 小时前
深入理解自连接_图书借阅情况(1/2)
数据库
Minyy111 小时前
Jdbc学习笔记(二)核心API--ResultSet
java·开发语言·数据库·mysql
敲代码敲到头发茂密1 小时前
MySQL索引、B+树相关知识总结
java·数据结构·数据库·b树·mysql·算法
米饭是菜qy2 小时前
MySQL 如何用C语言连接
数据库·mysql
feilieren2 小时前
MySQL 迁移 dm
数据库
打码人的日常分享2 小时前
智慧化工园区解决方案,数字化转型助力化工园区升级(PPT)
大数据·数据库·web安全·系统安全·规格说明书
Mephisto.java2 小时前
【大数据学习 | HBASE高级】rowkey的设计,hbase的预分区和压缩
大数据·sql·mysql·json·hbase·database
看山还是山,看水还是。3 小时前
Redis 命令
前端·数据库·redis·bootstrap