sql编程——join,concat,except,union all的使用举例。

sql题目

现需要请向所有用户推荐其朋友收藏但是用户自己未收藏的商品,请从好友关系表(friendship_info)和收藏表(favor_info)中查询出应向哪位用户推荐哪些商品。

friendship_info

user1_id(用户1 id) user2_id(用户2 id)
101 1010
101 108
101 106

favor_info

user_id(用户id) sku_id(商品id) create_date(收藏日期)
101 3 2021-09-23
101 12 2021-09-23
101 6 2021-09-25

期望效果

user_id <string> (用户id) sku_id <string> (应向该用户推荐的商品id)
101 2
101 4
101 7
101 9
101 8
101 11
101 1

题目讨论

本题的思路分析是,首先找到朋友收藏的商品,然后将朋友的商品剔除掉包含自己收藏的商品

1. 使用union all合并,然后使用having 求countI()为1
1.将好友表与收藏表join,获取好友收藏商品
sql 复制代码
select
      fi.user1_id as user_id,
  sku_id
from
  friendship_info fi
  join favor_info fo on fi.user2_id = fo.user_id
group by
  fi.user1_id,
  sku_id
2.查询自己收藏的商品,合并所有商品与用户
sql 复制代码
UNION ALL
select
  user_id,
  sku_id
from
  favor_info
3.对行数进行筛选,使用having过滤出统计数为1的即为用户未曾收藏的商品。
sql 复制代码
select
  user_id,
  sku_id
from t1
group by
  user_id,
  sku_id
having
  count(*) = 1
4.最终SQL
sql 复制代码
select
  user_id,
  sku_id
from
  (
    select
      user_id,
      sku_id
    from
      (
        select
          fi.user1_id as user_id,
          sku_id
        from
          friendship_info fi
          join favor_info fo on fi.user2_id = fo.user_id
        group by
          fi.user1_id,
          sku_id
      ) t1
    UNION ALL
    select
      user_id,
      sku_id
    from
      favor_info
  ) t
group by
  user_id,
  sku_id
having
  count(*) = 1
2.使用concat()拼接后,再去重
1.收藏表关联原表
sql 复制代码
friendship_info t1 

JOIN favor_info t2

on t1.user2_id=t2.user_id
2.拼接用户-商品作为一个字段
sql 复制代码
concat(t1.user1_id,t2.sku_id)
3.将用户-商品不存在的自己收藏的进行过滤
sql 复制代码
where concat(t1.user1_id,t2.sku_id) not in (

    SELECT concat(user_id,sku_id)

    from favor_info

)
4.最终SQL
sql 复制代码
SELECT t1.user1_id user_id,t2.sku_id

from friendship_info t1 

JOIN favor_info t2

on t1.user2_id=t2.user_id

where concat(t1.user1_id,t2.sku_id) not in (

    SELECT concat(user_id,sku_id)

    from favor_info

)

group by t1.user1_id,t2.sku_id
3.使用join连接获取所有数据,然后根据关联信息过滤不需要的数据

使用join进行关联我认为是最符合码农习惯的。关联获取数据然后根据左关联右关联,将控制空值过滤,该方法主要是熟悉join后数据集的生成结果

1.好友表关联收藏表,获取好友id
sql 复制代码
from friendship_info fi

join favor_info fi1

on fi.user2_id = fi1.user_id 
2.再次关联收藏表,获取用户信息以及收藏商品信息
sql 复制代码
left join favor_info fi2

on fi.user1_id = fi2.user_id and fi1.sku_id = fi2.sku_id
3. 按照商品关联情况过滤, 对用户,好友商品进行去重。
sql 复制代码
select distinct user1_id user_id,

    fi1.sku_id sku_id

from t1

where fi2.sku_id is null;
4.最终SQL
sql 复制代码
select distinct user1_id user_id,

    fi1.sku_id sku_id

from friendship_info fi

join favor_info fi1

on fi.user2_id = fi1.user_id 

left join favor_info fi2

on fi.user1_id = fi2.user_id and fi1.sku_id = fi2.sku_id

where fi2.sku_id is null;
4.使用except关键字,剔除重复数据。

except关键字有去重复数据效果,最新的hive语法支持except关键字。

可以使用 where ... is not exists替代except

sql 复制代码
select
  friendship_info.user1_id as user_id,
  sku_id
from
  friendship_info
  join favor_info on friendship_info.user2_id = favor_info.user_id
except
select
  user_id,
  sku_id
from
  favor_info

本题最主要的还是要懂join后的结果集,才能做到对重复数据,无效数据去重。

相关推荐
Re.不晚15 分钟前
MySQL进阶之战——索引、事务与锁、高可用架构的三重奏
数据库·mysql·架构
老邓计算机毕设25 分钟前
SSM智慧社区信息化服务平台4v5hv(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·ssm 框架·智慧社区、·信息化平台
麦聪聊数据1 小时前
为何通用堡垒机无法在数据库运维中实现精准风控?
数据库·sql·安全·低代码·架构
2301_790300961 小时前
Python数据库操作:SQLAlchemy ORM指南
jvm·数据库·python
m0_736919101 小时前
用Pandas处理时间序列数据(Time Series)
jvm·数据库·python
亓才孓1 小时前
[JDBC]PreparedStatement替代Statement
java·数据库
m0_466525292 小时前
绿盟科技风云卫AI安全能力平台成果重磅发布
大数据·数据库·人工智能·安全
爱学习的阿磊2 小时前
使用Fabric自动化你的部署流程
jvm·数据库·python
枷锁—sha2 小时前
【SRC】SQL注入快速判定与应对策略(一)
网络·数据库·sql·安全·网络安全·系统安全
惜分飞2 小时前
ORA-600 kcratr_nab_less_than_odr和ORA-600 4193故障处理--惜分飞
数据库·oracle