大数据面试SQL(五):查询最近一笔有效订单

文章目录

查询最近一笔有效订单

一、题目

二、分析

三、SQL实战

四、样例数据参考


查询最近一笔有效订单

一、题目

现有订单表t5_order,包含订单ID,订单时间,下单用户,当前订单是否有效。

请查询出每笔订单的上一笔有效订单,注意不是每笔订单都是有效的。

样例数据:

目标结果:

二、分析

本题是查询上一条记录的升级版本,所以考察的lag()函数,但是我们也不知道上一单是有效还是无效,所以这个题目难度就增加了很多。

维度 评分
题目难度 ⭐️⭐️⭐️⭐️⭐️
题目清晰度 ⭐️⭐️⭐️⭐️
业务常见度 ⭐️⭐️⭐️⭐️

三、SQL实战

1、先查询出有效订单,然后计算出每笔有效订单的上一单有效订单。

查询语句:

sql 复制代码
select ord_id,
       ord_time,
       user_name,
       is_valid,
       lag(ord_id) over (partition by user_name order by ord_time asc) as last_valid_ord_id
from (select ord_id,
             ord_time,
             user_name,
             is_valid
      from t5_order
      where is_valid = 1) t;

查询结果:

2、原始的明细数据与新的有效订单表按照用户进行关联,有效订单表的订单时间大于等于原始订单表。

查询语句:

sql 复制代码
with tmp as (
    -- 有效订单及其上一单有效记录
    select ord_id,
           ord_time,
           user_name,
           is_valid,
           lag(ord_id) over (partition by user_name order by ord_time asc) as last_valid_ord_id
    from (select ord_id,
                 ord_time,
                 user_name,
                 is_valid
          from t5_order
          where is_valid = 1) t)
select t1.*,
       t2.*
from t5_order t1
left join tmp t2 on t1.user_name = t2.user_name
where t1.ord_time <= t2.ord_time;

查询结果:

3、使用row_number,原始订单记录表中的user_name、ord_id进行分组,按照有效订单表的时间排序,增加分组排序。

查询语句:

sql 复制代码
with tmp as (
    -- 有效订单及其上一单有效记录
    select ord_id,
           ord_time,
           user_name,
           is_valid,
           lag(ord_id) over (partition by user_name order by ord_time asc) as last_valid_ord_id
    from (select ord_id,
                 ord_time,
                 user_name,
                 is_valid
          from t5_order
          where is_valid = 1) t)
select t1.*,
       t2.*,
       row_number() over (partition by t1.ord_id,t1.user_name order by t2.ord_time asc) as rn
from t5_order t1
left join tmp t2 on t1.user_name = t2.user_name
where t1.ord_time <= t2.ord_time;

我们可以看出,最终我们需要的就是rn=1 的记录。

查询结果:

4、去除冗余字段,筛选rn=1 的记录。

查询语句:

sql 复制代码
with tmp as (
    -- 有效订单及其上一单有效记录
    select ord_id,
           ord_time,
           user_name,
           is_valid,
           lag(ord_id) over (partition by user_name order by ord_time asc) as last_valid_ord_id
    from (select ord_id,
                 ord_time,
                 user_name,
                 is_valid
          from t5_order
          where is_valid = 1) t
)
select * from
(select t1.*,
       t2.*,
       row_number() over (partition by t1.ord_id,t1.user_name order by t2.ord_time asc) as rn
from t5_order t1
left join tmp t2 on t1.user_name = t2.user_name
where t1.ord_time <= t2.ord_time) tt
where tt.rn = 1;

查询结果:

四、样例数据参考

sql 复制代码
--建表语句
create table t5_order
(
    ord_id bigint COMMENT '订单ID',
    ord_time string COMMENT '订单时间',
    user_name string COMMENT '用户名',
    is_valid int COMMENT '订单是否有效'
);
-- 数据插入
insert into t5_order(ord_id,ord_time,user_name,is_valid)
values
    (1,'2024-08-11 12:01:03','姬小满',1),
    (2,'2024-08-11 12:02:06','姬小满',0),
    (3,'2024-08-11 12:03:15','姬小满',0),
    (4,'2024-08-11 12:04:20','姬小满',1),
    (5,'2024-08-11 12:05:03','姬小满',1),
    (6,'2024-08-11 12:01:02','甄姬',1),
    (7,'2024-08-11 12:03:03','甄姬',0),
    (8,'2024-08-11 12:04:01','甄姬',1),
    (9,'2024-08-11 12:07:03','甄姬',1);

  • 📢博客主页:https://lansonli.blog.csdn.net
  • 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!
  • 📢本文由 Lansonli 原创,首发于 CSDN博客🙉
  • 📢停下休息的时候不要忘了别人还在奔跑,希望大家抓紧时间学习,全力奔赴更美好的生活✨
相关推荐
Arva .14 分钟前
深度分页、读写分离、分库分表后 SQL 该如何优化?
数据库·sql
Hello.Reader33 分钟前
Flink CDC 用 PolarDB-X CDC 实时同步数据到 Elasticsearch
大数据·elasticsearch·flink
说私域1 小时前
智能名片链动2+1模式S2B2C商城小程序:构建私域生态“留”量时代的新引擎
大数据·人工智能·小程序
paperxie_xiexuo2 小时前
如何高效完成科研数据的初步分析?深度体验PaperXie AI科研工具中数据分析模块在统计描述、可视化与方法推荐场景下的实际应用表现
大数据·数据库·人工智能·数据分析
武子康3 小时前
大数据-160 Apache Kylin Cube 实战:从建模到构建与查询(含踩坑与优化)
大数据·后端·apache kylin
wind_one13 小时前
16。基础--SQL--DQL-分页查询
数据库·sql
非著名架构师3 小时前
智慧气象护航:构建陆海空立体交通气象安全保障体系
大数据·人工智能·安全·疾风气象大模型4.0·疾风气象大模型·风光功率预测
q***42053 小时前
python的sql解析库-sqlparse
数据库·python·sql
夏洛克信徒4 小时前
从 “工具” 到 “代理”:Gemini 3.0 重构 AI 能力边界,开启智能协作新纪元
大数据·人工智能·神经网络