MySQL高阶练习题2-没有广告的剧集

目录

题目

准备数据

分析数据

实现代码

总结


题目

找出所有没有广告出现过的剧集。 返回结果 无顺序要求

准备数据

sql 复制代码
create database db;
use db;

Create table If Not Exists Playback(session_id int,customer_id int,start_time int,end_time int);
Create table If Not Exists Ads (ad_id int, customer_id int, timestamp int);
Truncate table Playback;
insert into Playback (session_id, customer_id, start_time, end_time) values ('1', '1', '1', '5');
insert into Playback (session_id, customer_id, start_time, end_time) values ('2', '1', '15', '23');
insert into Playback (session_id, customer_id, start_time, end_time) values ('3', '2', '10', '12');
insert into Playback (session_id, customer_id, start_time, end_time) values ('4', '2', '17', '28');
insert into Playback (session_id, customer_id, start_time, end_time) values ('5', '2', '2', '8');
Truncate table Ads;
insert into Ads (ad_id, customer_id, timestamp) values ('1', '1', '5');
insert into Ads (ad_id, customer_id, timestamp) values ('2', '2', '17');
insert into Ads (ad_id, customer_id, timestamp) values ('3', '2', '20');

输入表

playback表

ads表

分析数据

实现代码

sql 复制代码
select session_id
from playback p left join ads a on
    p.customer_id = a.customer_id and timestamp between start_time and end_time
where a.customer_id is null;

总结

  • on后边的是连接条件,而where是过滤条件,连接条件是执行顺序是高于过滤条件
sql 复制代码
SELECT session_id
FROM playback p
LEFT JOIN ads a ON p.customer_id = a.customer_id 
               AND p.timestamp BETWEEN a.start_time AND a.end_time
WHERE a.customer_id IS NULL;
  • ON 子句中的条件 p.timestamp BETWEEN a.start_time AND a.end_time 是用来确定 playback 表中的记录是否与 ads 表中的记录匹配的。如果 playback 中的 timestamp 值在 ads 中的 start_time 和 end_time 之间,那么这条记录将与 ads 表中的记录进行连接。 然而,如果 a.customer_id IS NULL,这意味着尽管 timestamp 可能在 start_time 和 end_time 之间,但是没有匹配的 customer_id。
  • 换句话说,LEFT JOIN 会返回 playback 表中的所有记录,即使在 ads 表中没有找到匹配的 customer_id,但是 ads 表中 customer_id 必须为 NULL 的条件实际上是不可能的,因为 LEFT JOIN 保证了 playback 表中的每一行至少在结果集中出现一次,即使 ads 表中没有匹配的行。 这里可能出现的误解是,BETWEEN 条件被放在了 ON 子句中,而不是 WHERE 子句中。在大多数情况下,BETWEEN 可以作为过滤条件放在 WHERE 子句中,但是在这个特定的 LEFT JOIN 查询中,BETWEEN 条件用于确保只连接那些时间戳在特定范围内的记录。

如果将 BETWEEN 条件放在 WHERE 子句中,如下:

sql 复制代码
SELECT session_id
FROM playback p
LEFT JOIN ads a ON p.customer_id = a.customer_id 
WHERE p.timestamp BETWEEN a.start_time AND a.end_time
  AND a.customer_id IS NULL;
  • 这个查询将不会返回任何结果,因为 a.customer_id IS NULL 意味着没有找到匹配的 customer_id,而 p.timestamp BETWEEN a.start_time AND a.end_time 则要求 ads 表中必须有匹配的记录,这在逻辑上是矛盾的。
  • 因此,正确的做法是保持 BETWEEN 条件在 ON 子句中,以确保只连接时间戳在 ads 表指定时间范围内的记录,然后在 WHERE 子句中过滤出那些在 ads 表中没有找到匹配 customer_id 的记录。
相关推荐
时差9531 小时前
【面试题】Hive 查询:如何查找用户连续三天登录的记录
大数据·数据库·hive·sql·面试·database
让学习成为一种生活方式1 小时前
R包下载太慢安装中止的解决策略-R语言003
java·数据库·r语言
秋意钟1 小时前
MySQL日期类型选择建议
数据库·mysql
Dxy12393102162 小时前
python下载pdf
数据库·python·pdf
ac-er88882 小时前
MySQL如何实现PHP输入安全
mysql·安全·php
桀桀桀桀桀桀3 小时前
数据库中的用户管理和权限管理
数据库·mysql
superman超哥4 小时前
04 深入 Oracle 并发世界:MVCC、锁、闩锁、事务隔离与并发性能优化的探索
数据库·oracle·性能优化·dba
用户8007165452004 小时前
HTAP数据库国产化改造技术可行性方案分析
数据库
engchina5 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j
engchina5 小时前
使用 Cypher 查询语言在 Neo4j 中查找最短路径
数据库·neo4j