踏踏实实练SQLday1-1连续登录

踏踏实实练SQLday1

1连续登录

1.1查询连续登录3天以上的用户

字段名相同不会覆盖 -- select a,a,a -- 结果有三列

第一步去重

复制代码
select id,substr(date,1,10) as date 
from test 
group by id,substr(date,1,10)

substr(字段,i,j)截取多少位

第二步-开窗rownumber,用date减一下,对结果进行分组 -- over()

复制代码
select id,date,date_add(date,
-row_number() over(partition by id order by date)) as date1 
from 第一步子查询

overnumber开窗函数,用date减一下,对结果分组。


连续--想起123456789--想起用row_number

开窗函数知识图谱

over() 开窗函数

select普通字段和聚合函数不能一起使用

普通的聚合函数每组(Group by)只返回一个值,而开窗函数则可视为窗口中的每行都返回一个值。

对查询的结果多出一列,这一列可以是聚合值,也可以是排序值。

开窗函数一般就是over()函数,其窗口是由一个OVER子句定义的多行记录。

  • 聚合开窗函数

    sum(score) over (partition by subject order by score) as sum3

    sum(score) over (partition by subject 分区 order by score排序) as sum3

    max/min

    over(里) -- 分区排序 写在外面就必须写组函数,一组显示一行数据
    分区排序,写在开窗函数内就可以每行数据都显示出来

  • 排序开窗函数--4种(3+1)

    rank--1224
    .--1223
    rownumber--1234
    百分比--

第三步

复制代码
select id,date1,count(*) as day_cnt 
from 第二步子查询 
group by id ,date1 having count(*)>3



1.2查询连续登录最大天数用户

1.3某个用户连续登录天数

注意先where一下这个用户的数据过滤出来...之后步骤同第二步

某个用户最大连续登录天数 max(date)

1.4用户账户余额大于1000的连续天数

1.5'连续类'题目思路:rownumber() over() 减一下,在分组count

2 lead/lag使用(股票波峰波谷)

波峰:当天的价格大于前一天和后一天

波谷:当天的价格小于前一天和后一天

javascript 复制代码
select id,ds,price,case 
	when price>lag_price and price>lead_price then '波峰' 
	when price<lag_price and price<lead_price then '波谷' end as price_type
from(
	select id,ds,price,lag(price,1)over(partition by.id order by ds) as lag_price,
	lead(price,1)over(partition by.id order by ds) as lead_price
	from test
)t





3 连续12345

hive的连续开窗函数

4 三种排序(开窗)第几名/前几名/topN

5 天/月gmv汇总(聚合开窗)(一步步累计求和)

6 互相关注(共同好友)

7 炸裂函数

8 每一门课大于60分的学生

9 七日留存

相关推荐
juniperhan3 小时前
Flink 系列第24篇:Flink SQL 集成维度表指南:存储选型、参数调优与实战避坑
大数据·数据仓库·sql·flink
RestCloud16 小时前
ETL数据质量保障:如何通过优化提升数据准确性?
数据仓库·etl·数据处理·数据传输·数据同步·数据集成平台
2501_927283582 天前
荣联汇智助力天津艺虹打造“软硬一体”智慧工厂,全流程自动化引领印刷包装行业数智变革
大数据·运维·数据仓库·人工智能·低代码·自动化
孤雪心殇2 天前
快速上手数仓基础知识
数据仓库·hive·spark
渣渣盟2 天前
数据仓库 vs 数据湖 vs 湖仓一体:架构演进与选型
数据仓库·架构
juniperhan2 天前
Flink 系列第22篇:Flink SQL 参数配置与性能调优指南:从 Checkpoint 到聚合优化
大数据·数据仓库·分布式·sql·flink
juniperhan3 天前
Flink 系列第21篇:Flink SQL 函数与 UDF 全解读:类型推导、开发要点与 Module 扩展
java·大数据·数据仓库·分布式·sql·flink
地球资源数据云3 天前
1960年-2024年中国棉花产量数据集
大数据·数据结构·数据仓库·人工智能
i建模3 天前
在数据仓库(数仓)中,给数据打标签(Tagging)
数据仓库
地球资源数据云4 天前
1900-2023年中国物种分布点位矢量数据集
大数据·数据结构·数据库·数据仓库·人工智能