SQL面试题练习 —— 用户行为路径分析

目录

  • [1 题目](#1 题目)
  • [2 建表语句](#2 建表语句)
  • [3 题解](#3 题解)

题目来源:拼多多。

1 题目

有一张用户行为日志表 ods_usr_log, 包含用户id(user_id)和页面id(page_id)以及进入页面时间(in_ts)

问题:统计每天进入A页面后,立刻进入B页面,又进入C页面的用户数(注意:进入C页面之前可能进入过其他页面)

样例数据

2 建表语句

sql 复制代码
insert into ods_usr_log(user_id, page_id, in_ts) values 
(1, 'A', '2020-1-1 12:01:03'),
(2, 'A', '2020-1-1 12:01:04'),
(3, 'A', '2020-1-1 12:01:05'),
(1, 'B', '2020-1-1 12:03:03'),
(1, 'A', '2020-1-1 12:04:03'),
(1, 'C', '2020-1-1 12:06:03'),
(1, 'D', '2020-1-1 12:11:03'),
(2, 'A', '2020-1-1 12:07:04'),
(3, 'C', '2020-1-1 12:02:05'),
(2, 'C', '2020-1-1 12:09:03'),
(2, 'A', '2020-1-1 12:10:03'),
(4, 'A', '2020-1-1 12:01:03'),
(4, 'C', '2020-1-1 12:11:05'),
(4, 'D', '2020-1-1 12:15:05'),
(1, 'A', '2020-1-2 12:01:03'),
(2, 'A', '2020-1-2 12:01:04'),
(3, 'A', '2020-1-2 12:01:05'),
(1, 'B', '2020-1-2 12:03:03'),
(1, 'A', '2020-1-2 12:04:03'),
(1, 'C', '2020-1-2 12:06:03'),
(2, 'A', '2020-1-2 12:07:04'),
(3, 'B', '2020-1-2 12:08:05'),
(3, 'E', '2020-1-2 12:09:05'),
(3, 'D', '2020-1-2 12:11:05'),
(2, 'C', '2020-1-2 12:09:03'),
(4, 'E', '2020-1-2 12:05:03'),
(4, 'B', '2020-1-2 12:06:03'),
(4, 'E', '2020-1-2 12:07:03'),
(2, 'A', '2020-1-2 12:10:03');

3 题解

要想求按照 A->B->C 序列的用户,就需要知道每个用户的行为路径。这个不难求得,只需要将每个用户进入的页面按照进入时间进行concat即可。那么如何保证A到B是直接到达的,并且B到C是可能间接到达的呢?显然可以使用正则匹配 like %A,B%C%

sql 复制代码
select date(in_ts) as dt
      ,count(distinct user_id) as cnt
from
(
    select user_id
          ,in_ts
          ,concat_ws(',',collect_set(page_id) over(partition by user_id order by in_ts)) as page_list
    from ods_usr_log
) t
where page_list like '%A,B%C%'
group by date(in_ts)
;
相关推荐
国服第二切图仔21 分钟前
Rust开发之使用anyhow与thiserror简化错误处理
服务器·数据库·rust
金仓拾光集24 分钟前
金仓替代MongoDB:互联网医院聊天脱敏实战
数据库·mongodb·kingbase·kingbasees·数据库平替用金仓·金仓数据库
rexling126 分钟前
【MySQL】mysqldump使用方法
数据库·mysql·adb
2503_928411561 小时前
10.30 MySQL数据表操作
数据库·mysql
weixin_307779131 小时前
C#程序实现将Teradata的存储过程转换为Snowflake的sql的存储过程
数据库·数据仓库·c#·云计算·迁移学习
李高钢1 小时前
c#获取当前程序所在目录避坑
开发语言·数据库·c#
金仓拾光集2 小时前
金仓数据库践行社会责任:以技术驱动绿色计算与数据普惠
运维·数据库·oracle·kingbase·数据库平替用金仓·金仓数据库
金仓拾光集2 小时前
金仓数据库赋能地铁AFC系统升级:核心技术实现与落地
运维·数据库·ux·kingbase·kingbasees·数据库平替用金仓·金仓数据库
2503_928411563 小时前
10.31 MySQL数据记录操作
数据库·sql·mysql
CryptoRzz3 小时前
印度实时股票数据源接口对接文档-IPO新股、k线数据
java·开发语言·数据库·区块链