目录
题目
找出所有没有广告出现过的剧集。 返回结果 无顺序要求 。
准备数据
sql
create database db;
use db;
Create table If Not Exists Playback(session_id int,customer_id int,start_time int,end_time int);
Create table If Not Exists Ads (ad_id int, customer_id int, timestamp int);
Truncate table Playback;
insert into Playback (session_id, customer_id, start_time, end_time) values ('1', '1', '1', '5');
insert into Playback (session_id, customer_id, start_time, end_time) values ('2', '1', '15', '23');
insert into Playback (session_id, customer_id, start_time, end_time) values ('3', '2', '10', '12');
insert into Playback (session_id, customer_id, start_time, end_time) values ('4', '2', '17', '28');
insert into Playback (session_id, customer_id, start_time, end_time) values ('5', '2', '2', '8');
Truncate table Ads;
insert into Ads (ad_id, customer_id, timestamp) values ('1', '1', '5');
insert into Ads (ad_id, customer_id, timestamp) values ('2', '2', '17');
insert into Ads (ad_id, customer_id, timestamp) values ('3', '2', '20');
输入表
playback表
ads表
分析数据
实现代码
sql
select session_id
from playback p left join ads a on
p.customer_id = a.customer_id and timestamp between start_time and end_time
where a.customer_id is null;
总结
- on后边的是连接条件,而where是过滤条件,连接条件是执行顺序是高于过滤条件
sql
SELECT session_id
FROM playback p
LEFT JOIN ads a ON p.customer_id = a.customer_id
AND p.timestamp BETWEEN a.start_time AND a.end_time
WHERE a.customer_id IS NULL;
- ON 子句中的条件 p.timestamp BETWEEN a.start_time AND a.end_time 是用来确定 playback 表中的记录是否与 ads 表中的记录匹配的。如果 playback 中的 timestamp 值在 ads 中的 start_time 和 end_time 之间,那么这条记录将与 ads 表中的记录进行连接。 然而,如果 a.customer_id IS NULL,这意味着尽管 timestamp 可能在 start_time 和 end_time 之间,但是没有匹配的 customer_id。
- 换句话说,LEFT JOIN 会返回 playback 表中的所有记录,即使在 ads 表中没有找到匹配的 customer_id,但是 ads 表中 customer_id 必须为 NULL 的条件实际上是不可能的,因为 LEFT JOIN 保证了 playback 表中的每一行至少在结果集中出现一次,即使 ads 表中没有匹配的行。 这里可能出现的误解是,BETWEEN 条件被放在了 ON 子句中,而不是 WHERE 子句中。在大多数情况下,BETWEEN 可以作为过滤条件放在 WHERE 子句中,但是在这个特定的 LEFT JOIN 查询中,BETWEEN 条件用于确保只连接那些时间戳在特定范围内的记录。
如果将 BETWEEN 条件放在 WHERE 子句中,如下:
sql
SELECT session_id
FROM playback p
LEFT JOIN ads a ON p.customer_id = a.customer_id
WHERE p.timestamp BETWEEN a.start_time AND a.end_time
AND a.customer_id IS NULL;
- 这个查询将不会返回任何结果,因为 a.customer_id IS NULL 意味着没有找到匹配的 customer_id,而 p.timestamp BETWEEN a.start_time AND a.end_time 则要求 ads 表中必须有匹配的记录,这在逻辑上是矛盾的。
- 因此,正确的做法是保持 BETWEEN 条件在 ON 子句中,以确保只连接时间戳在 ads 表指定时间范围内的记录,然后在 WHERE 子句中过滤出那些在 ads 表中没有找到匹配 customer_id 的记录。