相信很多学习SQL的小伙伴都面临这样的困境,学习完书本上的SQL基础知识后,一方面想测试下自己的水平;另一方面想进一步提升,却不知道方法。
其实,对于技能型知识,我的观点一贯都是:多练习、多实践。正所谓实践出真知,学完书本的知识,很多时候也只能做到知道,距离熟练的应用还差的很远。
在咱们程序员圈子里,力扣(LeetCode)和牛客(nowcoder.com)是两个公认比较好的实践平台。题库比较多,还有不少大厂的笔试真题,特别适合找工作时撸一撸。当然,作为平时个人技术提升的练习题,也是非常不错的。
最近一段时间,我会先从力扣(LeetCode)的SQL题刷起。当然,顺序可能是随机的,欢迎小伙伴们点题。
题目:1308. 不同性别每日分数总计
(通过次数9,381 | 提交次数12,628,通过率74.29%)
表: Scores
+---------------+---------+
| Column Name | Type |
+---------------+---------+
| player_name | varchar |
| gender | varchar |
| day | date |
| score_points | int |
+---------------+---------+
(gender, day)是该表的主键
一场比赛是在女队和男队之间举行的
该表的每一行表示一个名叫 (player_name) 性别为 (gender) 的参赛者在某一天获得了 (score_points) 的分数
如果参赛者是女性,那么 gender 列为 'F',如果参赛者是男性,那么 gender 列为 'M'
写一条SQL语句查询每种性别在每一天的总分。
返回按gender和day对查询结果 升序排序的结果。
查询结果格式的示例如下。
示例 1:
输入:
Scores表:
+-------------+--------+------------+--------------+
| player_name | gender | day | score_points |
+-------------+--------+------------+--------------+
| Aron | F | 2020-01-01 | 17 |
| Alice | F | 2020-01-07 | 23 |
| Bajrang | M | 2020-01-07 | 7 |
| Khali | M | 2019-12-25 | 11 |
| Slaman | M | 2019-12-30 | 13 |
| Joe | M | 2019-12-31 | 3 |
| Jose | M | 2019-12-18 | 2 |
| Priya | F | 2019-12-31 | 23 |
| Priyanka | F | 2019-12-30 | 17 |
+-------------+--------+------------+--------------+
输出:
+--------+------------+-------+
| gender | day | total |
+--------+------------+-------+
| F | 2019-12-30 | 17 |
| F | 2019-12-31 | 40 |
| F | 2020-01-01 | 57 |
| F | 2020-01-07 | 80 |
| M | 2019-12-18 | 2 |
| M | 2019-12-25 | 13 |
| M | 2019-12-30 | 26 |
| M | 2019-12-31 | 29 |
| M | 2020-01-07 | 36 |
+--------+------------+-------+
解释:
女性队伍:
第一天是 2019-12-30,Priyanka 获得 17 分,队伍的总分是 17 分
第二天是 2019-12-31, Priya 获得 23 分,队伍的总分是 40 分
第三天是 2020-01-01, Aron 获得 17 分,队伍的总分是 57 分
第四天是 2020-01-07, Alice 获得 23 分,队伍的总分是 80 分
男性队伍:
第一天是 2019-12-18, Jose 获得 2 分,队伍的总分是 2 分
第二天是 2019-12-25, Khali 获得 11 分,队伍的总分是 13 分
第三天是 2019-12-30, Slaman 获得 13 分,队伍的总分是 26 分
第四天是 2019-12-31, Joe 获得 3 分,队伍的总分是 29 分
第五天是 2020-01-07, Bajrang 获得 7 分,队伍的总分是 36 分
来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/running-total-for-different-genders
#测试数据
Create table If Not Exists Scores (player_name varchar(20), gender varchar(1), day date, score_points int);
insert into Scores (player_name, gender, day, score_points) values ('Aron', 'F', '2020-01-01', '17');
insert into Scores (player_name, gender, day, score_points) values ('Alice', 'F', '2020-01-07', '23');
insert into Scores (player_name, gender, day, score_points) values ('Bajrang', 'M', '2020-01-07', '7');
insert into Scores (player_name, gender, day, score_points) values ('Khali', 'M', '2019-12-25', '11');
insert into Scores (player_name, gender, day, score_points) values ('Slaman', 'M', '2019-12-30', '13');
insert into Scores (player_name, gender, day, score_points) values ('Joe', 'M', '2019-12-31', '3');
insert into Scores (player_name, gender, day, score_points) values ('Jose', 'M', '2019-12-18', '2');
insert into Scores (player_name, gender, day, score_points) values ('Priya', 'F', '2019-12-31', '23');
insert into Scores (player_name, gender, day, score_points) values ('Priyanka', 'F', '2019-12-30', '17');
解题思路:
这道题在题目上其实有些描述不太准确的地方。
首先,题目里描述scores表的主键是(gender, day),但实际上,表里还有一个player_name的字段,难道每天同一个性别只有一个player(当然题目中给出的样例数据确实是这样,虽然跟实际情况可能不太相符)?
所以,相对来说,scores表的主键是(player_name, day)会比较合理一些。而gender仅仅是player_name的一个属性而已。
其次,题目要求计算"每种性别在每一天的总分"。根据题目下面的解释,可以知道,这个"总分",其实是从最开始日期累计到当天的总分,而不仅仅是当天的分数加总。
基于以上两点,我们再来看这道题。
源表scores的主键是(player_name, day),结果数据的主键是(gender, day)。而同一个gender下可能会存在多个player_name,所以,在计算上,需要做一次group by汇总操作。
简单来看,如果仅仅是计算每天每个性别的总分,那直接使用下面的SQL语句就可以了。
select
gender,day,sum(score_points) as total
from scores
group by gender,day
order by gender,day;
但题目实际上要求的是计算累计值,即:最开始的那一天到现在的累计总分。
关于累计的计算,在SQL编写的过程中,其实是一个比较经典,也比较常见的需求。常见于各类分析报表中。
思路上,一般来说,都是先构造出一个累加到每天的明细数据,然后再分组汇总即可。
具体到这道题,上面的SQL已经计算出了每天每个gender的汇总值,那么再将每一天的数据发散到所有比它大的日期上,最后再以gender+day分组汇总即可。
参考SQL:
with
total_score as (
select
gender,day,sum(score_points) as total
from scores
group by gender,day
order by gender,day
)
select
a.gender,
a.day,
sum(b.total) as total
from total_score a
inner join total_score b
on a.gender = b.gender
and a.day >= b.day
group by a.gender,a.day
order by a.gender,a.day;