Mysql进阶篇 - 技术栈

https://blog.csdn.net/2401_82607598/article/details/159435505?fromshare=blogdetail&sharetype=blogdetail&sharerId=159435505&sharerefer=PC&sharesource=2401_82607598&sharefrom=from_link

以上是Mysql基础。也可以说是SQL语句基础。

SQL

DDL数据定义语言，用于操作数据库、表、列等有create、alter、drop。。
DML数据操作语言，用于操作数据库中表的数据有insert、update、delete。。
DCL数据控制语言，用于操作访问权限和安全级别有grant，deny。。
DQL数据查询语言，用于查询数据select

数据类型

整数类型Tinyint、smallint、mediumint、int、bigint
浮点数类型和定点数类型float、double、decimal
字符串类型varchar、char、text
日期和时间类型
二进制类型

基本操作

创建数据库

sql 复制代码

create database 数据库名称;

查看数据库基本信息

sql 复制代码

show create database 数据库名称;

删除数据库

sql 复制代码

drop database 数据库;

查询所有数据库

sql 复制代码

show databases;

将数据库的字符集改成gbk

sql 复制代码

alter database 数据库 character set gbk;

切换数据库

sql 复制代码

use 数据库;

查看当前使用的数据库

sql 复制代码

select database();

数据表

数据库创建成功后可在该数据库中创建数据表(简称为表)存储数据。请注意：在操作数据表之前应使用"USE 数据库名;"指定操作是在哪个数据库中进行先关操作，否则会抛出"No database selected"错误。语法如下：

sql 复制代码

 create table 表名(
         字段1 字段类型,
         字段2 字段类型,
         ...
         字段n 字段类型
);

如

sql 复制代码

 create table student(
 id int,
 name varchar(20),
 gender varchar(10),
 birthday date
 );

查看数据表，查看数据库里有哪些数据表

sql 复制代码

show tables;

查看表的字段信息

sql 复制代码

desc student;

修改数据表

有时，希望对表中的某些信息进行修改，例如：修改表名、修改字段名、修改字段数据类型...等等。在MySQL中使用alter table修改数据表.

修改表名

sql 复制代码

alter table student rename to stu;

修改字段名

sql 复制代码

alter table stu change name sname varchar(10);

修改字段数据类型

sql 复制代码

alter table stu modify sname int;

增加字段

sql 复制代码

alter table stu add address varchar(50);

删除字段

sql 复制代码

alter table stu drop address;

删除数据表

sql 复制代码

drop table 表名;

数据表的约束

为防止错误的数据被插入到数据表，MySQL中定义了一些维护数据库完整性的规则；这些规则常称为表的约束。

主键约束
主键约束即primary key用于唯一的标识表中的每一行。被标识为主键的数据在表中是唯一的且其值不能为空。这点类似于我们每个人都有一个身份证号，并且这个身份证号是唯一的。
sql 复制代码
```
create table student(
id int primary key,
name varchar(20)
);

create table student01(
id int
name varchar(20),
primary key(id)
);
```
s
非空约束

非空约束即 NOT NULL指的是字段的值不能为空，基本的语法格式如下所示：
sql 复制代码
```
create table student02(
id int
name varchar(20) not null
);
```
默认值约束
默认值约束即DEFAULT用于给数据表中的字段指定默认值，即当在表中插入一条新记录时若未给该字段赋值，那么，数据库系统会自动为这个字段插入默认值；
sql 复制代码
```
create table student03(
id int,
name varchar(20),
gender varchar(10) default 'male'
);
```
s
唯一性约束

唯一性约束即UNIQUE用于保证数据表中字段的唯一性，即表中字段的值不能重复出现，其基本的语法格式如下所示：
sql 复制代码
```
create table student04(
id int,
name varchar(20) unique
);
```
s
外键约束

外键约束即FOREIGN KEY常用于多张表之间的约束。
sql 复制代码
```
create table student05(
id int primary key,
name varchar(20)
);
```
s

数据一致性概念

大家知道：建立外键是为了保证数据的完整和统一性。但是，如果主表中的数据被删除或修改从表中对应的数据该怎么办呢？很明显，从表中对应的数据也应该被删除，否则数据库中会存在很多无意义的垃圾数据。

删除外键

sql 复制代码

alter table 从表名 drop foreign key 外键名；

关于外键约束需要注意的细节

1、从表里的外键通常为主表的主键

2、从表里外键的数据类型必须与主表中主键的数据类型一致

3、主表发生变化时应注意主表与从表的数据一致性问题

数据表

插入数据

在MySQL通过INSERT语句向数据表中插入数据。

sql 复制代码

 create table student(
 id int,
 name varchar(30),
 age int,
 gender varchar(30)
 );

为表中所有字段插入数据

sql 复制代码

insert into student (id,name,age,gender) values (1,'bob',16,'male');

为表中指定字段插入数据

sql 复制代码

INSERT INTO 表名（字段名1,字段名2,...) VALUES (值 1,值 2,...);

同时插入多条记录

sql 复制代码

insert into student (id,name,age,gender) values (2,'lucy',17,'female'),(3,'jack',19,'male'),(4,'tom',18,'male');

更新数据

sql 复制代码

UPDATE 表名 SET 字段名1=值1[,字段名2 =值2,...] [WHERE 条件表达式];

将name为tom的记录的age设置为20并将其gender设置为female MySQL命令：

sql 复制代码

update student set age=20,gender='female' where name='tom';

UPDATE更新全部数据

sql 复制代码

update student set age=18;

删除数据

sql 复制代码

DELETE FROM 表名 [WHERE 条件表达式];

DELETE删除部分数据

sql 复制代码

delete from student where age=14;

DELETE删除全部数据

sql 复制代码

delete from student;

。。。。以上是一些易忘的基础语句。。

详细的having，roderby等等的运行顺序及使用记得复习。。以上没说，记得补上

存储引擎

MySQL体系结构

存储引擎介绍

存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式。

存储引擎是基于表的，而不是基于库的，所以存储引擎也可被称为表类型。

我们可以在创建表的时候，来指定选择的存储引擎，如果没有指定将**自动选择默认的存储引擎。**InnoDB

存储引擎特点

InnoDB

在 MySQL 5.5 之后，InnoDB是默认的 MySQL 存储引擎。

特点：

DML操作遵循ACID模型，支持事务；
行级锁，提高并发访问性能；
支持外键FOREIGN KEY约束，保证数据的完整性和正确性；

文件

xxx.ibd：xxx是表名，innoDB引擎的每张表都会对应这样一个表空间文件，存储该表的表结构（frm-早期的、sdi-新版的）、数据和索引。

sql 复制代码

 show variables  like 'innodb_file_per_table';

逻辑存储结构

表空间 : InnoDB存储引擎逻辑结构的最高层，ibd文件其实就是表空间文件，在表空间中可以包含多个Segment段。
段 : 常见的段有数据段、索引段、回滚段等。InnoDB中对于段的管理，都是引擎自身完成，不需要人为对其控制，一个段中包含多个区。
区 : 区是表空间的单元结构，每个区的大小为1M。默认情况下， InnoDB存储引擎页大小为16K，即一个区中一共有64个连续的页。
页 : 页是组成区的最小单元，页也是InnoDB 存储引擎磁盘管理的最小单元，即每次读取到内存的时候是读取一页的数据，每个页的大小默认为 16KB。为了保证页的连续性，InnoDB 存储引擎每次从磁盘申请 4-5 个区。
行 : InnoDB 存储引擎是面向行的，也就是说数据是按行进行存放的，在每一行中除了定义表时所指定的字段以外，还包含两个隐藏字段。

MyISAM

MyISAM是MySQL早期的默认存储引擎。

特点

不支持事务，不支持外键

支持表锁，不支持行锁

访问速度快

文件

xxx.sdi：存储表结构信息

xxx.MYD: 存储数据

xxx.MYI: 存储索引

Memory

Memory引擎的表数据时存储在内存中的，由于受到硬件问题、或断电问题的影响，只能将这些表作为临时表或缓存使用。

特点

hash索引（默认）

文件

xxx.sdi：存储表结构信息

面试题： InnoDB引擎与MyISAM引擎的区别 ?

①. InnoDB引擎, 支持事务, 而MyISAM不支持。

②. InnoDB引擎, 支持行锁和表锁, 而MyISAM仅支持表锁, 不支持行锁。

③. InnoDB引擎, 支持外键, 而MyISAM是不支持的。
主要是上述三点区别，当然也可以从索引结构、存储限制等方面，更加深入的回答，具体参考如下官方文档： https://dev.mysql.com/doc/refman/8.0/en/innodb-introduction.html https://dev.mysql.com/doc/refman/8.0/en/myisam-storage-engine.html

存储引擎选择

InnoDB: 是Mysql的默认存储引擎，支持事务、外键。如果应用对事务的完整性有比较高的要求，在并发条件下要求数据的一致性，数据操作除了插入和查询之外，还包含很多的更新、删除操作，那么InnoDB存储引擎是比较合适的选择。
MyISAM ：如果应用是以读操作和插入操作为主，只有很少的更新和删除操作，并且对事务的完整性、并发性要求不是很高，那么选择这个存储引擎是非常合适的。
MEMORY：将所有数据保存在内存中，访问速度快，通常用于临时表及缓存。MEMORY的缺陷就是对表的大小有限制，太大的表无法缓存在内存中，而且无法保障数据的安全性。

索引

索引（index）是帮助 MySQL 高效获取数据的数据结构。

数据库系统除了维护数据之外，还维护着索引。索引指向着数据。

索引结构

MySQL的索引是在存储引擎层实现的，不同的存储引擎有不同的索引结构，主要包含以下几种

不同的存储引擎对于索引结构的支持情况。

二叉树

如果选择二叉树作为索引结构，会存在以下缺点：

顺序插入时，会形成一个链表，查询性能大大降低。
大数据量情况下，层级较深，检索速度慢。

如果选择红黑树 作为索引结构，但在大数据量情况下，层级较深，检索速度慢。

B-Tree

B树：是一个多叉的平衡搜索树。

度数**（节点的子节点个数）**为5的B树，B树的每个节点最多存储4个Key，5个指针。

特点：

例如：5阶的B树，每一个节点最多存储4个key，对应5个指针
一旦节点存储的key数量到达5，就会裂变，中间元素向上分裂。
在B树中，非叶子节点和叶子节点都会存放数据。

B+Tree

B+Tree是B-Tree的变种，我们以一颗最大度数（max-degree）为4（4阶）的b+tree为例，来看一下其结构示意图：

绿色框框起来的部分，是索引部分，仅仅起到索引数据的作用，不存储数据。
红色框框起来的部分，是数据存储部分，在其叶子节点中要存储具体的数据。

B+Tree 与 B-Tree相比，主要有以下三点区别：

所有的数据都会出现在叶子节点。
叶子节点形成一个单向链表。
非叶子节点仅仅起到索引数据作用，具体的数据都是在叶子节点存放的

MySQL索引数据结构对经典的B+Tree进行了优化。

在原B+Tree的基础上，增加一个指向相邻叶子节点的链表指针，就形成了带有顺序指针的B+Tree，提高区间访问的性能，利于排序。

Hash MySQL中除了支持B+Tree索引，还支持一种索引类型---Hash索引。

哈希索引就是采用一定的hash算法，将键值换算成新的hash值，映射到对应的槽位上，然后存储在hash表中

如果两个(或多个)键值，映射到一个相同的槽位上，他们就产生了hash冲突（也称为hash碰撞），可以通过链表来解决

特点：

Hash索引只能用于对等比较 (=，in)，不支持范围查询（between，>，< ，...）
无法利用索引完成排序操作
查询效率高，通常(不存在hash冲突的情况)只需要一次检索就可以了，效率通常要高于B+tree索引

在MySQL中，支持hash索引的是Memory存储引擎。而InnoDB中具有自适应hash功能，hash索引是InnoDB存储引擎根据B+Tree索引在指定条件下自动构建的。

面试题：为什么InnoDB存储引擎选择使用B+tree索引结构

相对于二叉树，层级更少，搜索效率高

对于B-tree，无论是叶子节点还是非叶子节点，都会保存数据，这样导致一页中存储的键值减少，指针跟着减少，要同样保存大量数据，只能增加树的高度，导致性能降低。

相对Hash索引，B+tree支持范围匹配及排序操作

索引分类

在MySQL数据库 ，将索引的具体类型 主要分为以下几类：主键索引、唯一索引、常规索引、全文索引。

聚集索引&二级索引

而在InnoDB存储引擎中，**根据索引的存储形式，**又可以分为以下两种：

聚集索引选取规则:

如果存在主键，主键索引就是聚集索引。
如果不存在主键，将使用第一个唯一（UNIQUE）索引作为聚集索引。
如果表没有主键，或没有合适的唯一索引，则InnoDB会自动生成一个rowid作为隐藏的聚集索引。

聚集索引和二级索引的具体结构如下：

聚集索引的叶子节点下挂的是这一行的数据。
二级索引的叶子节点下挂的是该字段值对应的主键值。

回表查询：先到二级索引中查找数据，找到主键值，然后再到聚集索引中根据主键值，获取数据的方式，就称之为回表查询

思考题:

1、以下两条SQL语句，那个执行效率高? 为什么

复制代码

A. select * from user where id = 10 ; 
B. select * from user where name = 'Arm';
# id为主键，name字段创建的有索引

答：A 语句的执行性能要高于B 语句。

因为A语句直接走聚集索引，直接返回数据。而B语句需要先查询name字段的二级索引，然后再查询聚集索引，也就是需要进行回表查询

2、InnoDB主键索引的B+tree高度为多高呢？

美团: Mysql数据库中表的一行数据大小为1k，有五千万条记录，主键是bigint类型，求B+树的高是多少？

答：数据库的指针固定是占6个字节，主键是bigint类型的话是占8个字节，一页的大小是16k，一页可以存储16个行。

假设一页中有n个键值，n + 1个指针。n * 8 + (n + 1) * 6 = 1024 * 16 字节。

求出n之后，如果树的高度为2：存储的总行数 = (n + 1) * 16行。如果树的高度为3：存储的总行数 = (n + 1)^2 * 16。

进而推出公式：存储的总行数 = (n + 1)^（树高 - 1） * 16。然后将五千万带入求出树高。

五千万条记录的话，B+树的高是4

索引语法

创建索引

sql 复制代码

create  [ unique | fulltext ]  index  index_name  on  table_name  ( index_col_name,... );

查看索引

sql 复制代码

show  index  from  table_name;

删除索引

sql 复制代码

drop  index  index_name  on  table_name;

SQL性能分析

SQL执行频率

MySQL 客户端连接成功后，通过 show $session\|global$ status 命令可以提供服务器状态信息。通过如下指令，可以查看当前数据库的INSERT 、UPDATE、DELETE、SELECT的访问频次：

sql 复制代码

-- session 是查看当前会话 ;-- global 是查询全局数据 ;
 SHOW  GLOBAL STATUS LIKE  'Com_______';

那么通过查询SQL的执行频次，我们就能够知道当前数据库到底是增删改为主，还是查询为主。那假如说是以查询为主，我们又该如何定位针对于那些查询语句进行优化呢？次数我们可以借助于慢查询日志。

慢查询日志

慢查询日志记录了所有执行时间超过指定参数 （long_query_time，单位：秒，默认10秒）的所有SQL语句的日志。

MySQL的慢查询日志默认没有开启 ，我们可以查看一下系统变量 slow_query_log。

如果要开启慢查询日志，需要在MySQL的配置文件（C:\ProgramData\MySQL\MySQL Server 8.0的my.ini）中配置如下信息：

sql 复制代码

 # 开启MySQL慢日志查询开关
slow_query_log=1
 # 设置慢日志的时间为2秒，SQL语句执行时间超过2秒，就会视为慢查询，记录慢查询日志
long_query_time=2

配置完毕之后，重新启动MySQL服务器。

在慢查询日志中，只会记录执行时间超多我们预设时间（2s）的SQL，执行较快的SQL是不会记录的。

那这样，通过慢查询日志，就可以定位出执行效率比较低的SQL，从而有针对性的进行优化。

profile详情

show profiles 能够在做SQL优化时帮助我们了解SQL执行时间具体都耗费到哪里去了。

explain

explain 或者 desc 命令获取 MySQL 如何执行 select 语句的信息，包括在 select 语句执行过程中表如何连接和连接的顺序。

sql 复制代码

-- 直接在select语句之前加上关键字 explain / desc
 EXPLAIN   SELECT   字段列表   FROM   表名   WHERE  条件 ;

explain 执行计划中各个字段的含义

索引使用

最左前缀法则

如果索引了多列（联合索引），要遵守最左前缀法则。最左前缀法则指的是查询从索引的最左列开始，并且不跳过索引中的列。如果跳跃某一列，索引将会部分失效(后面的字段索引失效)。

注意：

注意：最左前缀法则中指的最左边的列，是指在查询时，联合索引的最左边的字段 (即是第一个字段) 必须存在，与我们编写SQL时，条件编写的先后顺序无关。

范围查询

联合索引中，出现范围查询(>,<)，范围查询右侧的列索引失效。

在业务允许的情况下，尽可能的使用类似于 >= 或 <= 这类的范围查询，而避免使用 > 或 <

索引失效情况

索引列计算

不要在索引列上进行运算操作，索引将失效。

sql 复制代码

 explain  select  *  from  tb_user  where  substring(phone,10,2) = '15'; # phone索引失效

字符串不加引号

字符串类型字段使用时，不加引号，索引将失效。

模糊查询

如果仅仅是尾部模糊匹配，索引不会失效。如果是头部模糊匹配，索引失效。

即在like模糊查询中，在关键字后面加%，索引可以生效。而如果在关键字前面加了%，索引将会失效

or连接条件

用or分割开的条件，如果or前的条件中的列有索引，而后面的列中没有索引，那么涉及的索引都不会被用到。

当or连接的条件，左右两侧字段都有索引时，索引才会生效。

数据分布影响

如果MySQL评估使用索引比全表更慢，则不使用索引。

SQL提示

SQL提示，是优化数据库的一个重要手段，简单来说，就是在SQL语句中加入一些人为的提示来达到优化操作的目的。

use index：建议MySQL使用哪一个索引完成此次查询（仅仅是建议，mysql内部还会再次进行评估）

sql 复制代码

 explain select * from tb_user use index(idx_user_pro) where profession = '软件工程';

ignore index ：忽略指定的索引。

sql 复制代码

 explain select * from tb_user ignore index(idx_user_pro) where profession = '软件工程';

force index ：强制使用索引。

sql 复制代码

 explain select * from tb_user force index(idx_user_pro) where profession = '软件工程';

覆盖索引

尽量使用覆盖索引 ，减少select *。

那么什么是覆盖索引呢？覆盖索引是指查询条件使用了索引 ，并且需要返回的列，在该索引中已经全部能够找到 。

接下来，我们来看一组SQL的执行计划，看看执行计划的差别，然后再来具体做一个解析。

sql 复制代码

explain select id, profession from tb_user where profession = '软件工程' and age = 31 and status = '0' ;
explain select id,profession,age, status from tb_user where profession = '软件工程' and age = 31 and status = '0' ;
explain select id,profession,age, status, name from tb_user where profession = '软件工程' and age = 31 and status = '0';
explain select * from tb_user where profession = '软件工程' and age = 31 and status = '0';

思考题：一张表, 有四个字段(id, username, password, status), 由于数据量大, 需要对以下SQL语句进行优化, 该如何进行才是最优方案: select id,username,password from tb_user where username = 'itcast';
答案: 针对于 username, password建立联合索引, sql为: create index idx_user_name_pass on tb_user(username,password);

这样可以避免上述的SQL语句，在查询的过程中，出现回表查询。

前缀索引

当字段类型为字符串（varchar，text，longtext等）时，有时候需要索引很长的字符串，这会让索引变得很大，查询时，浪费大量的磁盘IO，影响查询效率。此时可以只将字符串的一部分前缀，建立索引，这样可以大大节约索引空间，从而提高索引效率。

语法

sql 复制代码

create index  idx_xxxx on table_name(column(n));

单列索引与联合索引

单列索引：即一个索引只包含单个列。

联合索引：即一个索引包含了多个列。

在业务场景中，如果存在多个查询条件，考虑针对于查询字段建立索引时，建议建立联合索引，而非单列索引。

索引使用原则

针对于数据量较大，且查询比较频繁的表建立索引。
针对于常作为查询条件（where）、排序（order by）、分组（group by）操作的字段建立索引。
尽量选择区分度高的列作为索引，尽量建立唯一索引，区分度越高，使用索引的效率越高。
如果是字符串类型的字段，字段的长度较长，可以针对于字段的特点，建立前缀索引。
尽量使用联合索引，减少单列索引，查询时，联合索引很多时候可以覆盖索引，节省存储空间，避免回表，提高查询效率。
要控制索引的数量，索引并不是多多益善，索引越多，维护索引结构的代价也就越大，会影响增删改的效率。
如果索引列不能存储NULL值，请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时，它可以更好地确定哪个索引最有效地用于查询。