目录
3.4、最后是,写SQL查询或修改语句,可能会用到的各种数学、日期、字符处理函数
?7.11、第十一章节、上下行比较与连续(重复/递增)问题(20)
1、书籍来源
很久之间就关注到了公众号"SQL数据库开发"中,发布了SQL基础知识、SQL高级知识两本电子书,其中均为号主李岳所编写的公众号文章,围绕SQL语句的入门、进阶知识,然后进一步将历史发布的SQL训练题汇编为SQL145题的电子书,现在均已经迭代到第二版。
注意 :虽然,SQL语句几乎是关系型数据库的通用的调取数据的接口了,但是,各个数据库产品所支持的SQL语法还是有略微的不同。而这三本书,是作者基于微软的SQL Server数据库来编写的,理论、方法都是共通的,实操起来会有10~30%的不同,注意自行查资料区别开来。
2、入门难度
该套书的入门难度,不是零基础,哪怕是对"访问数据库→→使用SQL语句→→调取数据"有一点点经验的人,可能还是无法阅读下去"SQL基础知识"以及后两本书;这类人群,可能还是需要完完整整地跟着一套MySQL(或别的数据库)学习视频课,从安装、连接、建库、建表、各类常规查询、后端语言调用...一整套操作下来,然后进一步学这套书,就会有如虎添翼的感觉,而不是举步维艰、味同嚼蜡。而有后一种感觉,说明你学这套书的基础不够。
3、《SQL基础知识》的概览
在"SQL基础知识"中,作者从一条SQL查询语句的执行顺序讲起,然后一个关键字、一个关键字的研究讨论,其中内容分类起来,有如下几部分:
3.**1、**写一条SQL查询语句,必须掌握的基础知识。
- 第一章~第十四章:SELECT →DISTINCT →**...→ WHERE**→** AND**、OR→UNIOIN ALL
- **漏编入的一章:**GROUP BY关键字的"大哥":HAVING
- **第二十四章:**SQL查询语句的嵌套艺术:子查询
- **第二十章:**避免混淆,起别名的AS
- **第十八章:**一套查询语句的固定化:VIEW
3.2、之后,操作表结构及插入数据:
- **第十六章:**创建数据库、表、索引:CREATE;
- **第十七章:**修改表(操作列及其类型、约束(注:乃至索引)):AITER TABLE;
- **第十五章:**插入数据:SELECT INTO、INSERT INTO;
3.3、然后,一张数据表的结构组成元素
- **第三十章:**常用数据类型
- **第十九章:**不可忽视的NULL
- **第二十一章~第二十二章:**对于列的强制性格式规定:(六大)约束
- **第二十三章:**针对某些列,建的目录:索引
3.4、最后是,写SQL查询或修改语句,可能会用到的各种数学 、日期 、字符处理函数
- 第二十七章~第二十九章
3.5、事务
事务部分,是介绍,在多次修改表的数据的时候,要保证数据的安全所使用的一种技术,例如一次支付操作中,买家的账户扣款了,卖家的账户没有增加,就发生问题了。
- 第二十六章:数学、日期、字符处理
4、《SQL高级知识》的概览
4.1、更好地写好一条SQL查询语句
在"SQL高级知识"中,第一部分是针对写一个SQL查询语句的增强,使它可以实现更强的查询功能,与SQL Server数据库深度绑定的内容会多一些,
- 第二章:实现if条件判断的效果:CASE WHEN
- 第九章:开窗函数的应用:OVER()
- 第三章:from子句中,嵌套select查询,提高效率,但更复杂:派生表
- 第四章:访问另外一个数据库实例中的表(SQL Server的特性):DBLINK
- 第五章:union all的兄弟,交集与差集:集合的用法
- 第六章:group by的高级用法(SQL Server的特性):分组集
- 第十一章:对自连接进行深度增强:递归查询(文中例子专属SQL Server,MySQL中要变一下)
4.2、一种特殊的数据表的增删改的操作语句
一种SQL Server中,以某表的数据为基准,对另一个表的数据进行增删改的操作语句
- **第七章:**MERGE INTO
4.3、用后端编程的思维写SQL语句
将后端语言中,"定义变量→→条件判断→→循环→→参数、方法"的思维引入,与SQL语句深度结合,因此,形成了自定义函数、定时作业、存储过程 、触发器这四个组件(前二者书中没有涉及)。
虽然存储过程、触发器,已经是相对独立的、有特定功能的一组SQL语句,但其组成的基础,变量 、动态SQL,仍然可以单独拎出来,在客户端的SQL编辑页面,放在SQL语句中,去单独执行,我在MySQL8.0中,就是运用文中的理论,这样去测试的,但是语法是不同的。
之所以将,创建临时表这个章节归入此部分,是因为,我们在设计一个存储过程时,可能就会创建一个临时表,来保存一个SQL语句的查询结果,然后,在后续的某个步骤中,再去调用这个表中的结果,一切结束后,就自动删除该表了;而相对的,为开发BI报表去写一个SQL查询语句,或类似的场景,往往不能去额外创建表、使用动态SQL。
- 第十章:变量的用法
- 第一章:临时表的用法
- 第十三章:动态SQL的用法
- 第 十二章:流程控制的用法
- 第八章:存储过程的用法
- 第十四章:触发器的用法
5、《SQL基础知识》、《SQL高级知识》的分析与总结
5.1、《SQL基础知识》的特点
《SQL基础知识》的第一个特点是,系统性地带你走一遍,一条SQL(查询)语句所有涉及的关键字,一个一个的过,全面而细致。这样就不需要你在SQL学习的入门阶段,碰到一个不懂的,就到处去搜,不系统。因为假如这样做,你也不知道,你是否基本搞明白了------关于这个不懂的问题的所有该掌握的知识,以及,它和其他知识的关系是什么。
另外要说,第一章中,一条SELECT查询语句的执行顺序,简直是一条纲领,我们每天都在写SQL查询语句,几乎都要想,什么先执行、什么后执行,然后去设计处理步骤,如果你不能看懂这一部分的大致内容,可以说,剩下的所有内容都不必看,可以说,你没有入门写SQL语句这一行。
第二个特点是,系统性的了解一张数据表的创建、修改、结构组成、插入数据。数据库管理系统(DBMS)的组成单位就是一个个库→→一张张表,所以一定要明白,一张表所涉及的所有知识,这里,同样称赞岳哥的撰文的系统性。
最后,个人觉得,事务 部分,可以放在第二本书中。事务针对的是多个增删改语句的一组操作的执行安全问题,好比,支付业务操作中,买家的钱少了,卖家的钱必须加上去,不能存在后者不动的情况。它起源于,对某数据表进行频繁更新的操作,进一步地,当多个事务都涉及某个表的数据的更新操作,那谁先谁后呢,那影不影响查询的结果呢?这就引出了数据库管理系统(DBMS)中的事务隔离级别 与锁的设计,然后我们要研究,一条增删改SQL语句,是如何在数据库中运行的,由此会有很多展开讲的内容。所以在第一本书中,会觉得有点不搭,放在《SQL高级知识》会比较好。
5.2、《SQL高级知识》的特点
《SQL基础知识》的第一个特点是,在上文1.4.1中,所提到的,为了写一条更好的SQL查询语句,讲了很多高级用法,其中特别牛的是开窗函数 、递归,这两样,几乎是写一些有难度的查询SQL语句中,非常好用的特性,但是开窗函数在MySQL中,只支持8.0以上的版本;但是大多数的工作中都是写的普通难度的查询,似乎也用不到很高级的特性,因此,该部分中,用于条件判断的case when语句、派生表,倒是比较常用的。
第二个特点,当然是"**从变量到存储过程"**了。当你需要按照一整套流程去处理一次数据,其中步骤很多,涉及查与增删改,涉及很多的判断与循环,等等等等。那就必须系统地从变量学起,一直到怎么写出一个存储过程为止,这对于很多做数据处理,如数仓中的ETL的工作很有帮助。
并且,我也在上文的用词中,反复区别强调,SQL查询语句、SQL增删改语句的不同,前者只需要绞尽脑汁设计数据的转化步骤、得出一种很漂亮的数据结果,就完了;后者需要考虑很多东西,删那些、改哪些,先改什么、后改什么,所用的时间能不能少,锁表、并发咋办...
我觉得有一个缺点在于,例子都太简单了,应该给一些完整的难的存储过程的创建、设计、处理的例子,再者,缺少游标 和循环的讲解,只有条件判断,这两个也是写存储过程、自定义函数等的不可少的手段。总之,关于这方面的进一步全面的讲解,更难的例子,哪怕在第三本书中,都是缺少的。
总结:
整个两本书中,前一本+后一本的一半部分中,针对如何写好SQL查询语句,从SQL语句的关键字 开始,到数据库的表结构 ,再到一些高级查询的用法(开窗、递归) (但是没有讲到with 表表达式),以及变量、动态SQL、事务,可以说非常入门、系统、详尽、朴实。
后一本的另一半部分中,详细引入了利用SQL语句来编程的思想,从变量 开始,最终得到了触发器 和存储过 程。虽然没有进一步讲变量在SQL查询语句中的有难度的使用,讲存储过程中缺少了游标和循环 、自定义函数 、定时作业 、更难一些的完整样例,但仍然是入门的系统性、全面性的佳作。
可以说,完整阅读完了,你就在SQL相关的知识这一块,该会的都会了,没有知识盲点,完全有能力理解任何人写的SQL语句,也不会说,别人谈SQL的某一方面的东西,你一点概念也没有,完全懵。
最后,SQL语句这一块,其实并没有完全结束,除了上述提到的缺少的东西需要精进外,SQL增删改(存储过程)、SQL优化、数据库内部的原理、数据库运维...可能是下一步的内容。
6、《SQL145题目》的概览与分类
《SQL145题》是作者汇编以往发过的公Z号文章,汇编而来的,每一题都是题目、效果图、建表语句、解法(SQL Server+MySQL)、解析构成,非常适合阅读完上两本书的读者,在这本书中去训练。
但是有一个问题是,题目的编排是乱序的,也没有分章节,只有1~145题的顺序序号,如下图所示,是我拟定分类、加章标题、修改了每一题的标题后,整理如下。
整理的基本规则是,分类上,按照问题或解法的相似性 (二者高度相关,但不必然),顺序上,按问题或解法的难度,由易到难。但是有一些题目,其实并不能严格分类,比如说,序号11分类中,有一些题目是使用自连接的解法,但是没有归类到序号1分类中,这一题,我就认为问题的相似性高于解法的相似性。
7、145题的分章节讨论
所有的145题按章节,我大概分如下两个阶段:
- 基础
- 1、普通使用问题(16)
- 2、聚合函数的使用(17)
- 3、开窗函数(14)
- 4、日期处理问题(6)
- 5、综合题:普通使用+聚合函数+开窗函数+日期处理(8)
- 6、其他函数应用(7)
- 7、待分类(14+2)
- 专题
- 8、数学问题(5)
- 9、行列变换问题(14)
- 10、父子表与递归的问题(11)
- 11、上下行比较与连续问题(20)
- 12、动态SQL、函数与存储过程(10)
7.1、**第一章节、**普通使用问题(16)
在基础 阶段中,第一章节 普通使用问题,大多数题目,问题虽然各种各样,但是解法上,只需要"自连接+where条件筛选+case when"就可以,当然,少部分题目也有例外,会用到子查询、聚合函数等等,但是可以从题目难度、解题思路上,看出来,只是一种很简单的使用,所以,类似的题目,我归纳为"普通使用问题"。
7.2、**第二章节、**聚合函数的使用(17)
第二章节 聚合函数的使用,这一章比上一章更难的原因在于,一定会涉及分组group by的思想,将一组数据,按照某列进行分组,然后或聚合函数,或case when,或其他处理。因此,本章重点在于聚合函数的使用。
7.3、**第三章节、**开窗函数(14)
第三章节开窗函数中,较于上一章,显而易见,解法多围绕开窗函数;一类是sum()、count()、min()、max(),一类是row_number()、rank()、dense_rank()排序的,一类是lag()、lead()获取上下行的;它在select子句中使用,在over()中设定分组条件,并且还有一个不常设置的rows between选项。
7.4、**第四章节、**日期处理问题(6)
第四章节日期处理中,将一些涉及时间、日期的处理的问题,单独列在一起了;第4题使用了UNIX_TIMESTAMP()函数;144题要求判断一个日期是否是周一~周五;21题中,要求按照给定的一个日期,求出"该月第一天、最后一天;该周第一天、最后一天...",很有意思。
第108题比较难一点,给定一个日期区间的两列"2024-1-28,2024-2-2 ",要求求出其对应的月份,各有多少天,即得到两条数据,"1,4 "、"2,2"。
解法之一是,先找出最小日期值、最大日期值,然后生成一列按天数1去递增的日期列,再与源表相连,再按月份聚合,即可得出结果。
7.5、**第五章节、**综合题(8)
第五章节,因为是一套题,即一组源数据,出了很多个题目,而且前述的章节的内容这里都有涉及,所以算作是一次简单的单元测验(其中有一题,太过简单,故删除了一题)。
7.6、**第六章节、**其他函数的应用(7)
第六章节,其他函数的应用中,按MySQL算,其实涉及的函数不多,返回不为null的coalesce()函数,locate()、regexp_replace()字符串处理函数,rand()随机数函数,round()除法函数;但我在做题的过程中,其实遇到了很多小众一点的函数,例如cast(),lpad(),rpad(),if(),regexp正则,group_concat()等等等等,但是如果都收录进该章,可能会破坏其他章节的分类,故这一章的分类,有点名不副实。
7.7、**第七章节、**待分类(14+2)
第七章节,待分类中,是将分类特征不明显的,或单列一类后数量太少,都放在其中。24、53题,是一种技巧的运用,比较简单;
30、68题,介绍了列之间的模糊匹配的办法。
select * from table wherecol1 like concat('%',col2,'%')
79、94题,要求得出每一行中,列值中的最大值,实际上,解法就是把比较的几个列并在一起,就好求了。
select id,col1
union all
select id,col2
union all
select id,col3
96、132、91、92题中,涉及一种分配问题,如下图所示,按红色图示分配,生成绿色地一列分配结果,思路是很简单,先求出待分配列地累计结果,然后写复杂的case when来判断边界值是否越过,分情况得出分配结果列。
88、145题中,是一种累计求和的问题,比如第1天1分钱、第2天2分钱、第3天4分钱...以此类推,第N天多少钱,基本都可以视情况,使用递归或sum()over()开窗函数求出来,实在不行,还有存储过程,去编程。
105、46题,是出了一道更新语句、一道删除语句题,故此分类。
7.8、**第八章节、**数学问题(5)
本章节中,归类的都是一些数学问题,使用SQL求解。试举其中的53题为例,给出一列数,要求任意几个数组合,相加的结果在90~100之间,求出符合该要求的所有组合。解法上,可以使用递归,每次递归,得到累加和、相加的公式字符串,结束递归的条件设置为,累加和在小于100,最后再筛选大于90的。递归的效果图,如下所示:
7.9、**第九章节、**行列变换问题(16)
本章归类的问题,从传统的"行转列"问题引申,扩大到,列/行的拆分和合并问题,并且由易到难。74题中,要求两个表,逐行拼接到一起,如下所示,解法很简单,row_number()分别给一个序号,再连接一下、取全集即可。60题中,要求筛除出某行的三列值,其实union all合并为一行就行了。
106、78、77题中,涉及"多行合并为一行"问题,如下所示,其实,MySQL中,group_concat()函数很容易操作,分组再用它聚合起来,很简单。
51题中,涉及一个反过来的问题,"一行拆分为多行",这在PostgreSQL中,也是一个函数的事儿------regexp_split_to_table(String, pattern),直接实现如下图的效果;MySQL8.0中,只能通过递归+substring(每次从第一个逗号","处截取)实现了,代码如下;
WITH RECURSIVE SplitStrings AS (
-- 初始查询:从字符串中提取第一个元素
SELECT
SUBSTRING_INDEX('a,b,c', ',', 1) AS value,
SUBSTRING('a,b,c', LENGTH(SUBSTRING_INDEX('a,b,c', ',', 1)) + 2) AS remaining
UNION ALL
-- 递归部分:继续处理剩余的字符串
SELECT
SUBSTRING_INDEX(remaining, ',', 1) AS value,
SUBSTRING(remaining, LENGTH(SUBSTRING_INDEX(remaining, ',', 1)) + 2)
FROM SplitStrings
WHERE remaining != ''
)
-- 选择最终结果
SELECT value
FROM SplitStrings;
11、107、116、111、22题中,是经典的"列转行"问题,如下图所示,解法就是group by+case when,代码如下:
CREATE TABLE sales_data (
year INT,
period ENUM('上半年', '下半年'),
amount INT
);
INSERT INTO sales_data (year, period, amount)
VALUES
(2018, '上半年', 100),
(2018, '下半年', 200),
(2019, '上半年', 300),
(2019, '下半年', 400),
(2020, '上半年', 300),
(2020, '下半年', 200);
SELECT
year,
SUM(CASE WHEN period = '上半年' THEN amount ELSE 0 END) AS 上半年,
SUM(CASE WHEN period = '下半年' THEN amount ELSE 0 END) AS 下半年
FROM sales_data
GROUP BY year;
122、82、85题中,是一种"行增加"问题,如下图所示,按照某列的值,重复增加对应的行。解法上,可以使用递归,但是更常见的,是与一列自然数去自连接的方法,如下图所示,MySQL8.0中得到一列自然数,可以使用变量操作,代码如下,熟悉后,就比较简单。
而49、131题中,则是需要使用递归,操作的是日期值。
总而言之,MySQL8.0中,行增加,只有两种方式,一种是递归,一种是自连接,如下所示。
SELECT @aa:=@aa+1 as aa from
(SELECT 1 UNION SELECT 2 UNION SELECT 3 UNION SELECT 4 UNION SELECT 5) t1,
(SELECT 1 UNION SELECT 2 UNION SELECT 3 UNION SELECT 4 UNION SELECT 5) t2,
(SELECT @aa:=0) aa
7.10、**第十章节、**父子表与递归的问题(9)
本章节中,所谓父子表,就是将有层级关系的行记录放在一张表中,通过父ID来指向上一条记录,如下图所示,类似的地名(省-市-县)也是典型的父子表。一般涉及父子表各种问题中,解法上的重点,一个是自连接 ,一个就是递归,这也是为什么本章将父子表与递归关联在一起。
如66、45题中,只是简单的在父子表中的父ID、子ID关联的基础上,做简单查询,故不讨论。
如25、100、112题中,涉及如下图所示的转换要求,即展示所有层级关系于一行,只要我们画出层级图来,知道有N层后,然后从根节点去joinN层就ok了,代码样例如下。
select m1.name,m2.name,m3.name
from Mytable m1
left join Mytable m2 on m1.父ID=m2.ID
left join Mytable m3 on m2.父ID=m3.ID
54、109、97题中是,要求加一列,来展示对应的节点的层级关系,解法是用递归去做,从根节点开始,一层层地向下递归,每次递归时拼接对应字符串,最终得到如下所示结果。
-- MySQL8中,注意,每个递归中,递归原点里,字符串列的长度,如下所示,要转一下格式,否则
-- ,后续递归公式中的所对应的字符串列长度是不会超过该列的;
WITH recursive CTE AS(
-- ↓↓递归原点,部分
SELECT ID,name,父ID,Cast(name as char) AS PATH
FROM Mytable t
WHERE 父ID is nulll
UNION ALL
-- ↓↓递归公式,部分
SELECT C.ID,C.name,C.父ID,CONCAT(CTE.PATH,'->',Cast(C.name as char)) PATH
FROM Mytable C
INNER JOIN CTE ON C.父ID=CTE.ID
)
-- ↓↓递归结果,部分
SELECT * FROM CTE
115题中,要求按某个层级,去求所属节点的和,解法同上,只是递归原点设定"where 父ID=1",然后拼接字符串变成求累加和。
7.11、**第十一章节、**上下行比较与连续(重复/递增)问题(20)
本章节的所有题目分为三组,如下所示,一方面是涉及上下行的比较,得出一些结果;一方面是,对按某一序列排列的行,找出重复行或连续行,进行分组,之后再进行一些组内排序,或行合并,这部分难度偏大,涉及一些特定的算法或用法。
- 11.1、上下行问题
- 11.2、序列、连续分组:组内连续次数
- 11.3、序列、连续分组:合并组
7.11.1、上下行问题
上下行问题 中,基本要求进行上下行的比较 ,生成比较结果,然后做进一步筛选,效果如下图所示,解法上都是做自连接,条件设置为与下一行去连接,或者在select子句中,用子查询,也能达到下图所示的效果;
当要求查出连续(重复)出现两次、三次的数据时,需要进一步使用自连接+筛选
【自连接+筛选】:如下图所示,伪代码如下所示;
原理上,先得到笛卡尔积,对于连续重复二次,去识别每行的上一行或下一行是否重复,是,则选入该行;对于连续重复三次,去识别每行的下一行and下二行,或上一行and下一行,或上一行and上二行,是否是重复的,是,则选入该行。最后对源表去重即可。
-- 连续两次
select DISTINCT m1.*
from Mytable m1, Mytable m2
where(m1.id+1=m2.id or m1.id-1 =m2.id)
and m1.name=m2.name
-- 连续三次
select DISTINCT m1.*
from Mytable m1, Mytable m2 , Mytable m3
where
(
(m1.id+1=m2.id and m1.id+2=m3.id) or
(m1.id-1=m2.id and m1.id+1=m3.id) or
(m1.id-1=m2.id and m1.id-2=m3.id)
)
and m1.name=m2.name
and m1.name=m3.name
7.**11.2、**序列、连续分组:组内连续次数
这一节中,要求按某一序列,对连续(重复)的行进行分组,得出每组的连续次数 。解法上,需要使用"两列差序相减 、子查询法、变量迭代每一行"的办法,先对连续行分组,然后直接组内生成一列序号,标识出每行的连续(重复)出现的次数。
如下图所示,按id序列,要求对连续(重复)的行,计算出其连续次数列,不连续则重新计数
【**两列差序相减】:**如下图所示,伪代码如下所示;
原理是,利用row_number函数,先生成一列每行加一的自然数列,再按name分组生成一列每行加一的自然数列,二者相减得到group列。于是,你会发现每一个name连续重复的区间,都标识为相同的group值,再进一步,按照group列分组、原id列排序,就可以得到每个name值,连续(重复)出现的次数列。
with t1 as (
select
id,name,
row_number()over(order by id) row_number1,
row_number()over(partition by name order by id) row_number2,
from Mytable
),t2 as (
select
id,name,row_number1,row_number2,
row_number1-row_number2 group,
from t1
)
select id,name,row_number1,row_number2,group,
row_number()over(partition by group,name order by id) rank,
-- 注意,此处不仅按照group列分组,↑↑还额外添加了name列来分组,可以堵住漏洞
from t2
【两列差序相减法的漏洞 】:如下图中绿色框中所示,就是同一个的group值下,居然会对应不同的name值;但是问题并不严重,很容易解决,在生成rank列时,注意下,按照group、name两列来分组即可。
【子查询法】:原理是,每行中,使用子查询,查出该序列中,该行以上、反向的、最近的一条的row_number列值,两个row_number列值相减,恰好为连续增长列
with t1 as (
SELECT
id,name,row_number(order by id)over() as rn
FROM Mytable a;
)
SELECT
a.id,a.name,
a.rn- COALESCE((
SELECT
b.rn
FROM Mytable b
WHERE b.rn < a.rn
AND b.name <> a.name
ORDER BY b.rn DESC
LIMIT 1
), 0) AS 连续增长次数
FROM Mytable a;
【变量迭代每一行】:这种方法是上一种的替代,原理是,利用两个变量在select子句中进行每一行的遍历,判断是否是连续区间,是,则group_id不变,不是,则group_id加一;伪代码如下所示:
with t1 as (
select
id,name,
@group_id:=if(@prev_name s null or @prev_name!=name,@group_id+1,@group_id) group_id,
@prev_name:=num prev_name
from Mytable join (SELECT @group_id:=0,@prev_name:=null) tt
order by id
)
SELECT id,num,group_id,row_number()over(partition by group_id order by id) rank
from t1
如前文所说,已经讲了三种方法来解决,连续(重复)问题,然而还有一类变种问题是,连续(递增)问题,如下图所示,该如何统计其连续区间、连续次数呢?
【两列差序相减法】:以上图中日期为例,先使用源表中最小、最大日期,生成一个全量日期的序列表,然后左连接源表,如下图所示,二列相减,id-rn,即可得到连续区间标识列,rn2列,之后再row_number()over()统计连续次数
【子查询法】:还没有写,但是从思路来说,也可以写出来。
【变量迭代每一行】:思路、解法、写法,稍改下识别条件即可,与前文大致一样。
select id,
DATE_FORMAT(date,'%Y-%m-%d') date,
@group_id:=if(@prev_date is null or DATEDIFF(DATE_FORMAT(date,'%Y-%m-%d'),@prev_date)>1,@group_id+1,@group_id) group_id,
@prev_date:=DATE_FORMAT(date,'%Y-%m-%d') prev_date
from Mytable join (SELECT @group_id:=0,@prev_date:=null)tt
order by DATE_FORMAT(date,'%Y-%m-%d')
7.**11.3、**序列、连续分组:合并组
这小节的问题是,在上一节的基础上,合并连续行为一行,其实已经很简单了,按照上一节的解法,找出连续区间,标识出来,然后,MySQL8.0中,直接使用concat()加聚合函数即可,故不再详述。
7.12、**第十二章节、**动态SQL、函数与存储过程(10)
在本章节中,涵盖编写动态SQL、自定义函数、存储过程三个方面,如下所示。
- 动态SQL:73、134题
- 自定义函数:43、93、139、140、141题
- 存储过程:62、137、138题
在MySQL8.0中,自定义函数 只能返回一个值,而不是一个表的结果集,所以可以拼接在普通SQL语句中使用;存储过程中,可以进行查、增删改的处理,各种条件判断、循环,包括建表、临时表,但是没有返回值,可以在末尾中写一个查询语句,然后"call Stored_Procedure_name"调用后,会得到一个结果集,但是是不能放在普通SQL语句中的。
动态SQL 的73、134题中,涉及的问题是,当不确定有多少列或列非常多时,该如何实现列转行?解法是,在观察原始的case when解法中,可以得出规律------有多少个列转行,就会写多少个max(case when),那么,我需要先把time列的值取出,依次包装为一个max(case when)的字符串,然后连在一起,最后再拼出一个SQL语句,最后再执行即可,这就是动态SQL的解法。
select
name,
-- ↓↓↓
max(case when time='1点' then 1 end) '1点',
max(case when time='3点' then 1 end) '3点',
max(case when time='5点' then 1 end) '5点',
max(case when time='6点' then 1 end) '6点',
max(case when time='9点' then 1 end) '9点',
max(case when time='12点' then 1 end) '12点'
-- ↑↑↑
from Mytable
group by name
-- MySQL8.0
-- 动态SQL
select @AE:=group_concat(concat("case when time='",time,"' then 1 end) '",time,),',') AS aa
from
(
select distinct time from Mytable order by time
)tt
SET @AE = CONCAT('select name,', @AE , 'from Mytable group by name');
PREPARE stmm FROM @AE;
EXECUTE stmm;
DEALLOCATE PREPARE stmm;
自定义函数的43、93、139、140、141题中,主要是正对数值或字符串的处理,此处直接附上第141题的答案,自定义一个函数,将字符串中的中文字符提取出来,MySQL8.0版。
DROP FUNCTION IF EXISTS ExtractChineseChars;
DELIMITER $
CREATE FUNCTION ExtractChineseChars(inputStr TEXT)
RETURNS TEXT
DETERMINISTIC -- 此处两行为MySQl的某种设置,必须加
NO SQL
BEGIN
DECLARE outputStr TEXT DEFAULT '';
DECLARE i INT DEFAULT 1;
DECLARE mid_char varchar(1);
-- 循环遍历输入字符串中的每个字符
WHILE i <= CHAR_LENGTH(inputStr) DO
-- 获取当前字符的Unicode编码
-- 字符串中的相应位置的一个字符取出
SET mid_char = MID(inputStr, i, 1);
-- 检查是否是中文字符 (中文字符的Unicode范围大致是4E00到9fa5)
IF mid_char REGEXP '[\x{4e00}-\x{9fa5}]' THEN
-- 如果是中文字符,则添加到输出字符串
SET outputStr = CONCAT(outputStr, MID(inputStr, i, 1));
END IF;
-- 索引加一
SET i = i + 1;
END WHILE;
RETURN outputStr;
END$
DELIMITER ;
存储过程的62、137、138题中,以137题为例,直接附上建存储过程的代码,原理上,是先建一张临时表,设置一个循环,将每日的日期插入其中,然后执行该表的查询,最后删除该临时表,结束存储过程,之后call去调用它来得到一张日期表。
drop PROCEDURE if EXISTS GenerateCalendar;
DELIMITER $
CREATE PROCEDURE GenerateCalendar(IN year INT)
BEGIN
DECLARE month INT DEFAULT 1;
DECLARE day INT DEFAULT 1;
DECLARE days_in_month INT;
DECLARE is_leap_year BOOLEAN;
DECLARE date_str VARCHAR(255);
-- 检查是否是闰年
SET is_leap_year = (year % 4 = 0 AND (year % 100 != 0 OR year % 400 = 0));
-- 创建临时表来存储日历数据
CREATE TEMPORARY TABLE IF NOT EXISTS Calendar (
date DATE
);
-- 清空临时表
TRUNCATE TABLE Calendar;
-- 循环遍历每个月
WHILE month <= 12 DO
-- 获取当前月份的天数
CASE
WHEN month IN (1, 3, 5, 7, 8, 10, 12) THEN SET days_in_month = 31;
WHEN month IN (4, 6, 9, 11) THEN SET days_in_month = 30;
WHEN month = 2 THEN
IF is_leap_year THEN
SET days_in_month = 29;
ELSE
SET days_in_month = 28;
END IF;
END CASE;
-- 循环遍历当月的每一天
WHILE day <= days_in_month DO
-- 插入日期到临时表
INSERT INTO Calendar (date) VALUES (DATE_FORMAT(CONCAT(year, '-', LPAD(month, 2, '0'), '-', LPAD(day, 2, '0')), '%Y-%m-%d'));
SET day = day + 1;
END WHILE;
-- 重置天数并增加月份
SET day = 1;
SET month = month + 1;
END WHILE;
-- 查询并显示日历
SELECT date,year(date) year,month(date) month,WEEKday(date)+1 week_day,DAYOFMONTH(date)day
FROM Calendar ORDER BY date;
-- 删除临时表
DROP TEMPORARY TABLE Calendar;
END$
DELIMITER ;
call GenerateCalendar(2024);