经典sql题(七)查找直播间最大在线人数

使用 SQL 分析房间用户状态变化

本文将详细介绍如何使用 SQL 的窗口函数和聚合函数,分析用户在房间中的状态变化,目标是计算每个房间指定时间段内的最大用户状态。

示例数据

假设我们的数据表包含以下字段:

room_id user_id login_time logout_time
101 1 2023-03-10 12:05:00 2023-03-10 12:45:00
101 2 2023-03-10 12:10:00 2023-03-10 12:50:00
102 3 2023-03-10 12:00:00 2023-03-10 13:00:00
102 4 2023-03-10 12:30:00 2023-03-10 13:30:00

第一步:提取事件并标记类型

在这一步,我们将从原始数据中提取每个用户的登录和退出事件,并为每个事件分配一个类型标记(1 表示登录,-1 表示退出)。

提取登录事件
sql 复制代码
SELECT 
    room_id,
    user_id,
    UNIX_TIMESTAMP(login_time) AS event_time,
    1 AS user_type
FROM 
    table
WHERE 
    FROM_UNIXTIME(UNIX_TIMESTAMP(login_time), '%Y%m%d') = '20230310'
    AND (HOUR(login_time) BETWEEN 12 AND 13)
结果示例
room_id user_id event_time user_type
101 1 1615375500 1
101 2 1615375800 1
102 3 1615375200 1
102 4 1615377000 1
提取退出事件
sql 复制代码
SELECT 
    room_id,
    user_id,
    UNIX_TIMESTAMP(logout_time) AS event_time,
    -1 AS user_type
FROM 
    table
WHERE 
    FROM_UNIXTIME(UNIX_TIMESTAMP(logout_time), '%Y%m%d') = '20230310'
    AND (HOUR(logout_time) BETWEEN 12 AND 13)
结果示例
room_id user_id event_time user_type
101 1 1615377900 -1
101 2 1615378200 -1
102 3 1615378800 -1
102 4 1615379400 -1
合并结果

我们将登录和退出事件通过 UNION ALL 合并,以获得完整的事件列表。

sql 复制代码
SELECT 
    room_id,
    user_id,
    event_time,
    user_type
FROM (
    -- 登录事件
    SELECT 
        room_id,
        user_id,
        UNIX_TIMESTAMP(login_time) AS event_time,
        1 AS user_type
    FROM 
        table
    WHERE 
        FROM_UNIXTIME(UNIX_TIMESTAMP(login_time), '%Y%m%d') = '20230310'
        AND (HOUR(login_time) BETWEEN 12 AND 13)
    UNION ALL
    -- 退出事件
    SELECT 
        room_id,
        user_id,
        UNIX_TIMESTAMP(logout_time) AS event_time,
        -1 AS user_type
    FROM 
        table
    WHERE 
        FROM_UNIXTIME(UNIX_TIMESTAMP(logout_time), '%Y%m%d') = '20230310'
        AND (HOUR(logout_time) BETWEEN 12 AND 13)
) AS events
合并结果示例
room_id user_id event_time user_type
101 1 1615375500 1
101 2 1615375800 1
102 3 1615375200 1
102 4 1615377000 1
101 1 1615377900 -1
101 2 1615378200 -1
102 3 1615378800 -1
102 4 1615379400 -1

第二步:计算累积用户状态

使用窗口函数累积计算用户状态。

sql 复制代码
SELECT
    room_id,
    user_id,
    user_type,
    SUM(user_type) OVER (PARTITION BY room_id ORDER BY event_time) AS status
FROM (
    -- 上一步的查询
) AS events

结果示例

room_id user_id user_type status
101 1 1 1
101 2 1 2
101 1 -1 1
101 2 -1 0
102 3 1 1
102 4 1 2
102 3 -1 1
102 4 -1 0

第三步:求最大状态

通过聚合函数求每个房间的最大状态。

sql 复制代码
SELECT
    room_id,
    MAX(status) AS max_status
FROM (
    -- 上一步的状态查询
) AS status_calculation
GROUP BY
    room_id;

结果示例

room_id max_status
101 2
102 2

解析

  • 数据准备:合并登录和退出事件,标记事件类型。
  • 计算状态 :使用 SUM() OVER 计算累积状态。
  • 求最大状态 :通过 MAX(status) 获取最大用户状态。
相关推荐
HackTwoHub2 小时前
AI大模型网关存在SQL注入、附 POC 复现、影响版本LiteLLM 1.81.16~1.83.7(CVE-2026-42208)
数据库·人工智能·sql·网络安全·系统安全·网络攻击模型·安全架构
l1t2 小时前
DeepSeek总结的DuckLake构建基于 SQL 原生表格式的下一代数据湖仓
数据库·sql
KmSH8umpK3 小时前
Redis分布式锁从原生手写到Redisson高阶落地,附线上死锁复盘优化方案进阶第八篇
数据库·redis·分布式
TDengine (老段)3 小时前
从施工监测到运营预警,桥科院用 TDengine 提升桥梁数据管理能力
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
宁波鹿语心理3 小时前
无条件的在场:一项极简亲子依恋修复练习的机制分析与实证观察
大数据
S1998_1997111609•X4 小时前
论mysql国盾shell-sfa犯罪行为集团下的分项工程及反向注入原理尐深度纳米算法下的鐌檵鄐鉎行为
网络·数据库·网络协议·百度·开闭原则
KmSH8umpK5 小时前
Redis分布式锁从原生手写到Redisson高阶落地,附线上死锁复盘优化方案进阶第七篇
数据库·redis·分布式
yaodong5186 小时前
不会Python也能数据分析:Gemini 3.1 Pro解决办公问题的SQL自动生成
python·sql·数据分析
BU摆烂会噶6 小时前
【LangGraph】持久化实现的三大能力——时间旅行
数据库·人工智能·python·postgresql·langchain
l1t7 小时前
DeepSeek总结的DuckLake 入门
数据库