SQL题解之使用union和sum解决同时在线人数问题

现有各直播间的用户访问记录表(live_events)如下,表中每行数据表达的信息为,一个用户何时进入了一个直播间,又在何时离开了该直播间。

user_id (用户id) live_id (直播间id) in_datetime (进入直播间的时间) out_datetime (离开直播间的时间)
100 1 2021-12-1 19:30:00 2021-12-1 19:53:00
100 2 2021-12-1 21:01:00 2021-12-1 22:00:00
101 1 2021-12-1 19:05:00 2021-12-1 20:55:00

现要求统计各直播间最大同时在线人数,期望结果如下:

live_id <int> (直播id) max_user_count <int> (最大人数)
1 4
2 3
3 2

--- 1.计算逻辑

对于同时在线人数问题,可以把数据进行处理后,然后将出入时间变成一个字段,同时打上标记为1或-1表示进入离开直播间,同时使用sum()函数累加这个字段,最大值为峰值人数

-- 1.对数据进行处理

in_datetime dt, out_datetime dt 设置为时间日期字段,同时打上进入出去标记1,-1

-- 2.union成一个字段
sql 复制代码
     select
        live_id,
        in_datetime dt,
        1 flag
    from live_events
    union all
    select 
        live_id,
        out_datetime,
        -1
    from live_events
-- 3.使用sum over()开窗函数累加人数

按照直播间分区并按照时间进行排序

sql 复制代码
 sum(flag) over(partition by live_id order by dt asc) as ct
--4. 求最大的人数

按照直播间分组,求最大人数

sql 复制代码
 max(ct) as  max_user_count
group by live_id
-- 5.最终SQL
sql 复制代码
select
	live_id,
    max(ct) as  max_user_count
from 
(
  select
      live_id,
      dt,
      sum(flag) over(partition by live_id order by dt asc) as ct
  from 
  (
    select
        live_id,
        in_datetime dt,
        1 flag
    from live_events
    union all
    select 
        live_id,
        out_datetime,
        -1
    from live_events
  )t1
)t2
group by live_id
相关推荐
鸿乃江边鸟4 天前
向量化和列式存储
大数据·sql·向量化
懒虫虫~5 天前
通过内存去重替换SQL中distinct,优化SQL查询效率
java·sql·慢sql治理
逛逛GitHub5 天前
1 个神级智能问数工具,刚开源就 1500 Star 了。
sql·github
Huhbbjs5 天前
SQL 核心概念与实践总结
开发语言·数据库·sql
咋吃都不胖lyh5 天前
SQL-字符串函数、数值函数、日期函数
sql
sensenlin915 天前
Mybatis中SQL全大写或全小写影响执行性能吗
数据库·sql·mybatis
xqlily5 天前
SQL 数据库简介
数据库·sql
森林-5 天前
MyBatis 从入门到精通(第三篇)—— 动态 SQL、关联查询与查询缓存
sql·缓存·mybatis
小虾米vivian5 天前
达梦:将sql通过shell脚本的方式放在后台执行
服务器·数据库·sql