SQL题目记录

1.商品推荐题目

1.思路:

  • 通过取差集 得出要推荐的商品
  • 差集的选取:except直接取差集 或者a left join b on where b = null

2.知识点

1.except
sql 复制代码
select
  friendship_info.user1_id as user_id,
  sku_id
from
  friendship_info
  join favor_info on friendship_info.user2_id = favor_info.user_id
except
select
  user_id,
  sku_id
from
  favor_info
2.交并差

2.连续日期

1. 思路:

1.通过lag(向上) lead(向下)求出2天,三天比较
2.通过rk和日期进行相减
  • 其实就是连续的日期进行分组,将连续的放入一组,不连续的放入另一组
  • 第一步, 使用开窗 构造rk
  • 计算日期和rk的差值,算出差值日期,这个差值日期就保证同一个分组,
  • 使用开窗count 算出每个分组是否有 符合要求的 >=2
sql 复制代码
  with
  s1 as (
    select
      user_id,
      date (login_ts) start_date,
      row_number() OVER (
        PARTITION by
          user_id
        order by
          date (login_ts)
      ) rk
    from
      user_login_detail
    GROUP by
      user_id,
      date (login_ts)
  ),
  s11 as (
    select
      user_id,
      start_date,
      date_sub (start_date, rk) head_date
    from
      s1
  )
select
  user_id,
  min(start_date) `start_date`,
  max(start_date) `end_date`
from  s11 
GROUP by user_id,
  head_date
HAVING datediff(max(start_date) ,min(start_date))>=1

3. 截止到某天统计最近几天的总和和平均值

1.思路

其实想法都是一样的,要求截止到当天,最近3天的数据,就要把前两天的数据拿过来,

方法有两个,一个是自连接join 一个是直接开窗

1. join

join需要考虑空值,分母就少了,所以需要一个if判断

2.开窗函数

开窗直接sum avg 但是首先注意,这里时间是String类型,无法进行between and

需要转化成日期类型或者时间戳(秒 毫秒 都是int类型)

注意range的用法,range 的between and 是根据 前面的值进行减法 加法

比如 order by timestamp_day RANGE BETWEEN 172800 PRECEDING and current row 就是 范围是 当前行的timestamp_day -172800 到当前行 如果后面用following就是加

sql 复制代码
with
  s1 as (
    select
      create_date,
      sum(total_amount) total_Day,
      unix_timestamp(date(create_date)) timestamp_day
    from
      order_info
    GROUP by
      create_date
  )
select
	create_date,

    cast(sum(total_Day) over(order by timestamp_day RANGE BETWEEN  172800 PRECEDING and current row ) as decimal(16,2)) total_3d,
    cast(avg(total_Day) over(order by timestamp_day RANGE BETWEEN  172800 PRECEDING and current row ) as DECIMAl(16,2) )avg_3d
from s1
相关推荐
寂夜了无痕23 分钟前
MySQL 主从延迟全链路根因诊断与破局法则
数据库·mysql·mysql主从延迟
爱丽_26 分钟前
分页为什么越翻越慢:offset 陷阱、seek 分页与索引排序优化
数据库·mysql
APguantou30 分钟前
NCRE-三级数据库技术-第12章-备份与数据库恢复
数据库·sqlserver
Bat U34 分钟前
MySQL数据库|表设计+新增+分组查询
数据库·mysql
麦聪聊数据1 小时前
企业数据流通与敏捷API交付实战(五):异构数据跨库联邦与零代码发布
数据库·sql·低代码·restful
Elastic 中国社区官方博客1 小时前
当 TSDS 遇到 ILM:设计不会拒绝延迟数据的时间序列数据流
大数据·运维·数据库·elasticsearch·搜索引擎·logstash
Omics Pro1 小时前
虚拟细胞:开启HIV/AIDS治疗新纪元的关键?
大数据·数据库·人工智能·深度学习·算法·机器学习·计算机视觉
J2虾虾1 小时前
MySQL的基本操作
数据库·mysql
arvin_xiaoting1 小时前
OpenClaw学习总结_III_自动化系统_3:CronJobs详解
数据库·学习·自动化
杨云龙UP1 小时前
Oracle 中 NOMOUNT、MOUNT、OPEN 怎么理解? 在不同场景下如何操作?_20260402
linux·运维·数据库·oracle