一、存储引擎概念介绍
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎
存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式
MySQL数据库中的组件,负责执行实际的数据I/O操作
MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储
二、MySQL常用的存储引擎
2.1 MyISAM
MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的
访问速度快 ,对事务完整性没有要求
MyISAM 适合查询 、插入为主的应用场景
MyISAM在磁盘上存储成三个文件,文件名和表名都相同,但是扩展名分别为:
.frm 文件存储表结构的定义
数据文件的扩展名为 .MYD (MYData)
索引文件的扩展名是**.MYI** (MYIndex)
数据库在读写过程中出现相互阻塞的现象主要是由于并发控制机制的作用。在多用户同时访问数据库时,为了保证数据的一致性和完整性,数据库系统会引入锁机制,防止多个事务同时修改同一数据,造成数据不一致。
MyIsam 是表级锁定,读或写无法同时进行
好处是:分开执行时,速度快、资源占用相对较少(相对)
表级锁定(Table-level Locking)是数据库管理系统中的一种锁定机制,它会在数据库操作期间锁定整个表,而不是锁定表中的个别行。当一个事务对某个表进行写操作(如INSERT、UPDATE或DELETE)时,数据库系统会为该表施加表级锁,从而阻止其他事务在同一时间内对这个表进行写操作,有时甚至阻止其他事务对该表进行读操作,直至持有表级锁的事务完成并释放锁。
特性:数据单独写入或读取,速度过程较快且占用资源相对少
2.1.1 MyISAM 表支持 3 种不同的存储格式
(1)静态(固定长度)表
静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。
char(10) 固定长度10
存储非常迅速,容器缓存,故障之后容易恢复
(2)动态表
动态表包含可变字段(varchar),记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 optimize table 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难。
(3)压缩表
压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。
2.2 MyISAM适用的生产场景
公司业务不需要事务的支持
单方面读取或写入数据比较多的业务
MyISAM存储引擎数据读写都比较频繁场景不适合
使用读写并发访问相对较低的业务
数据修改相对较少的业务
对数据业务一致性要求不是非常高的业务
服务器硬件资源相对比较差
MyIsam:适合于单方向的任务场景、同时并发量不高、对于事务要求不高的场景
2.3 InnoDB
InnoDB特点
- 支持事务,支持4个事务隔离级别(数据不一致问题)
- MySQL从5.5.5版本开始,默认的存储引擎为 InnoDB
- 5.5 之前是myisam (isam) 默认
- 行级锁定,但是全表扫描仍然会是表级锁定(select ),如
- update table set a=1 where user like '%lic%';
- 读写阻塞与事务隔离级别相关
- 能非常高效的缓存索引和数据
- 表与主键以簇的方式存储
- 支持分区、表空间,类似oracle数据库(5.5 ---------> 5.6 和5.7 第三代数据库8.0后版本)
- 支持外键约束,5.5前不支持全文索引,5.5后支持全文索引
- 对硬件资源要求还是比较高的场合
InnoDB 中不保存表的行数,如 select count(*) from table; 时 ( count(*) 函数返回表中的行数),InnoDB 需要扫描一遍整个表来计算有多少行,但是 MyISAM 只要简单的读出保存好的行数即可。需要注意的是,当 count(*)语句包含 where 条件时 MyISAM 也需要扫描整个表
对于自增长的字段,InnoDB 中必须包含只有该字段的索引
但是在 MyISAM 表中可以和其他字段一起建立组合索引
- 清空整个表时,InnoDB 是一行一行的删除,效率非常慢。MyISAM 则会重建表(truncate)
关于死锁
MyISAM : 表级锁定
innodb : 行级锁定
当两个请求分别访问/读取2行记录,同时又需要读取对方的记录数据,因为(行锁的限制)而造成了阻塞的现象
三、企业选择存储引擎依据
3.1 需要考虑每个存储引擎提供的核心功能及应用场景
业务场景如果并发量大,什么并发量大,读写的并发量大,那我们建议使用innoDB 如果单独的写入或是插入单独的查询,那我们建议使用MyISAM
表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低;
行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高;
MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的
3.2 支持的字段和数据类型
- 所有引擎都支持通用的数据类型
- 但不是所有的引擎都支持其它的字段类型,如二进制对象
3.3 锁定类型:不同的存储引擎支持不同级别的锁定
- 表锁定: MyISAM 支持
- 行锁定: InnoDB 支持
3.4 索引的支持
- 建立索引在搜索和恢复数据库中的数据时能显著提高性能
- 不同的存储引擎提供不同的制作索引的技术
- 有些存储引擎根本不支持索引
3.5 事务处理的支持
- 提高在向表中更新和插入信息期间的可靠性
- 可根据企业业务是否要支持事务选择存储引擎 innodb
四、存储引擎的查看和修改
4.1 查看系统支持的存储引擎
show engines;
4.2 查看表使用的存储引擎
方法一、
show table status from 库名 where name='表名'\G;
例子:
方法二、
use 库名;
show create table 表名;
例子:
4.3 修改存储引擎
方法一:通过 alter table 修改 表的存储引擎
use 库名;
alter table 表名 engine=myisam;
方法二:通过修改 /etc/my.cnf 配置文件,指定默认存储引擎并重启服务
vim /etc/my.cnf
[mysqld]
default-storage-engine=INNODB
#在[mysqld] 下添加该字段 重启服务即可
systemctl restart mysqld.service
#注意:此方法只对修改了配置文件并重启mysql服务后新创建的表有效,已经存在的表不会有变更。
方法三:通过 create table 创建表时指定存储引擎
use 库名;
create table 表名(字段1 数据类型,...) engine=myisam;
例子:
扩展
Mysql 死锁、悲观锁、乐观锁
锁机制是为了避免,在数据库有并发事务的时候,可能会产生数据的不一致而诞生的的一个机制。
锁从类别上分为:
- 共享锁:又叫做读锁,当用户要进行数据的读取时,对数据加上共享锁,共享锁可以同时加上多个。
- 排他锁:又叫做写锁,当用户要进行数据的写入时,对数据加上排他锁,排他锁只可以加一个,他和其他的排他锁,共享锁都相斥。
MySQL有三种锁的级别:页级、表级、行级。
- 表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。
- 行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高。
- 页面锁:开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定粒度界于表锁和行锁之间,并发度
死锁
MyISAM中是不会产生死锁的,因为MyISAM总是一次性获得所需的全部锁,要么全部满足,要么全部等待。而在InnoDB中,锁是逐步获得的,就造成了死锁的可能。
两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程。
产生死锁的原因主要是
(1)系统资源不足。
(2)进程运行推进的顺序不合适。
(3)资源分配不当等。
如果系统资源充足,进程的资源请求都能够得到满足,死锁出现的可能性就很低,否则就会因争夺有限的资源而陷入死锁。其次,进程运行推进顺序与速度不同,也可能产生死锁。
产生死锁的四个必要条件
死锁4大要素:互斥,持有并请求,不可剥夺,持续等待
(1) 互斥条件:一个资源每次只能被一个进程使用。
(2) 请求与保持条件:一个进程因请求资源而阻塞时,对已获得的资源保持不放。
(3) 不剥夺条件:进程已获得的资源,在末使用完之前,不能强行剥夺。
(4) 循环等待条件:若干进程之间形成一种头尾相接的循环等待资源关系。
这四个条件是死锁的必要条件,只要系统发生死锁,这些条件必然成立,而只要上述条件之一不满足,就不会发生死锁。
解决方法
1、撤消陷于死锁的全部进程;
2、逐个撤消陷于死锁的进程,直到死锁不存在;
3、从陷于死锁的进程中逐个强迫放弃所占用的资源,直至死锁消失。
4、从另外一些进程那里强行剥夺足够数量的资源分配给死锁进程,以解除死锁状态
如何避免死锁
1.使用事务时,尽量缩短事务的逻辑处理过程,及早提交或回滚事务;
2.设置死锁超时参数为合理范围,如:3分钟-10分种;超过时间,自动放弃本次操作,避免进程悬挂;
3.优化程序,检查并避免死锁现象出现;
4.对所有的脚本和SP都要仔细测试,在正式版本之前;
5.所有的SP都要有错误处理(通过@error);
6.一般不要修改SQL SERVER事务的默认级别。不推荐强行加锁。
- 以固定的顺序访问表和行。
分为两种情景:
对于不同事务访问不同的表,尽量做到访问表的顺序一致;
对于不同事务访问相同的表,尽量对记录的id做好排序,执行顺序一致;
-
大事务拆小。大事务更倾向于死锁,如果业务允许,将大事务拆小。
-
在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率。
-
降低隔离级别。如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从RR调整为RC,可以避免掉很多因为gap锁造成的死锁。
-
为表添加合理的索引。可以看到如果不走索引将会为表的每一行记录添加上锁,死锁的概率大大增大
小总结
关于索引
什么是索引?
索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
索引有什么作用?
通常情况下我们在表中查找数据需要把整个表遍历一遍,这样查找会导致客户在访问时出现卡顿现象。
使用索引后就可以直接定位到该数据的具体位置,不需要把整个表都遍历一遍。
便于客户端获取数据(提升用户体验感)+ 减少mysql 服务器的压力
索引就是一种MySQL的优化(从两个方向考虑,1、哪些字段/场景适合创建索引2、哪些字段/场景不适合)
索引有哪些副作用?
1.索引需要占用额外的磁盘空间。
2.在插入和修改数据时要花费更多的时间,因为索引也要随之变动。
创建索引的原则依据(MySQL 的优化 哪些字段/场景适合创建索引,哪些不适合)
1、小字段
2、唯一性强的字段
3、更新不频繁,但查询率很高的字段
4、表记录超过300+行(实际情况下1000+才做)
5、主键、外键、唯一键
索引类型:
① 普通索引 :最基本的索引类型,没有唯一性之类的限制。
② 唯一索引 :与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值
如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
③ 主键索引 :是一种特殊的唯一索引,必须指定为"PRIMARY KEY"。一个表只能有一个主键,不允许有空值。
④ 组合索引 :可以是单列,也可以是在多列上创建的索引。
需要满足最左原则,在使用select 语句查询时where条件使用的字段顺序必须和组合索引中的排序一致,
否则索引将不会生效。
⑤ 全文索引 :适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。
全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引。
关于事务
什么是事务?
所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。
事务特性(ACID) 也可以是特点
原子性 (一个整体,要么都执行要么都不执行)
一致性 要求事务前后数据的完整和一致
隔离性 要求多个事务之间不相互影响依赖(4个影响,4个隔离级别)
持久性 当事务提交后将永久保存,不可再回滚
事务之间的相互影响
脏读(读取未提交数据):脏读指的是读到了其他事务未提交的数据,未提交意味着这些数据可能会回滚,也就是可能最终不会存到数据库中,也就是不存在的数据。读到了并一定最终存在的数据,这就是脏读
不可重复读(前后多次读取,数据内容不一致):一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。
幻读(前后多次读取,数据总量不一致):在以下例子中,事务A虽然在可重复读隔离级别下避免了不可重复读问题,但它未能感知到事务B对账户X余额的更新,即出现了幻读现象。
事务A 开始,在可重复读(Repeatable Read)隔离级别下执行以下查询。假设事务A查找账户X,
其余额为1200元。事务B 开始,从账户X中转账500元到账户Y,并提交了事务。事务A 再次执行相同
的查询: 由于事务A在可重复读隔离级别下,它读取的账户X的余额仍为1200元。事务A 决定从账户X
中扣款800元,并执行更新操作
此时,事务A试图扣款800元,但实际上账户X在事务B的影响下,余额只剩下700元,
如果事务A的扣款操作成功,会导致账户X的余额变成-100元,这是不合法的。
丢失更新:两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
数据不一致的情况(四种) 事务隔离级别
(1)read uncommitted(未提交读) : 读取尚未提交的数据 :不解决脏读
允许脏读,其他事务只要修改了数据,即使未提交,本事务也能看到修改后的数据值。也就是可能读取到其他会话中未提交事务修改的数居。
(2)read committed(提交读):读取已经提交的数据 :可以解决脏读
只能读取到已经提交的数据。Oracle等多数数据库默认都是该级别〈不重复读)。
(3)repeatable read(可重复度):重读读取:可以解决脏读 和 不可重复读 ---mysql默认的
可重复读。无论其他事务是否修改并提交了数据,在这个事务中看到的数据值始终不受其他事务影响
(4)serializable:串行化:可以解决 脏读 不可重复读 和 幻读---相当于锁表
完全串行化的读,每次读都需要获得表级共享锁,读写相互都会阻塞。
mysql默认的事务处理级别是 repeatable read ,而Oracle和SQL Server是 read committed 。
隔离级别作用范围:
全局级:对所有的会话有效
会话级:只对当前的会话有效
MyISAM 和 INNODB区别(差异)
- InnoDB支持事物,而MylSAM不支持事物。
- lnnoDB支持行级锁,而MylSAM支持表级锁.
- InnoDB支持MVCC(多版本并发控制),而MlSAM不支持。
- lnnoDB支持外键。而MyISAM不支持。
- MylSAM支持全文索引,lnnoDB 5.5版本后支持全文索引。
INNODB
支持事务读写并发外键5.5版本以后支持全文索引行级锁定(在用like模糊匹配全表扫描时会表级锁定)对硬件资源要求较高,特别是内存高可以提高缓存能力
三个文件存储.frm(表结构) .ibd (表数据文件同时也是索引文件) db.opt (表属性文件)适合场景有事务要求的一致性要求高的读写并发量高的
MyISAM
不支持事务外键表级锁定
读写会相互阻塞支持全文索引资源消耗较低
三个文件存储 .frm(表结构).MYI(索引文件).MYD(数据文件)三种存储格式静态表动态表压缩表
适合场景单独的读取或插入
你们公司用哪种存储引擎
这是高级开发者面试时经常被问的问题。实际我们在平时的开发中,经常会遇到的,在用SQLyog等工具创建表时,就有一个引擎项要你去选。
Mysql的存储引擎有这么多种,实际我们在平时用的最多的莫过于InnoDB和MyISAM了。
只需要知道这两个常用的就行。
他们都有什么特点和区别
MyISAM和InnoDB的特点:
MyISAM :默认表类型,它是基于传统的ISAM类型,ISAM是Indexed Sequential Access Method
(有索引的顺序访问方法) 的缩写,它是存储记录和文件的标准方法。不是事务安全的,而且不支持
外键,如果执行大量的select,insert MyISAM比较适合。
InnoDB :支持事务安全的引擎,支持外键、行锁、事务是他的最大特点。如果有大量的update和insert,
建议使用InnoDB,特别是针对多个并发和QPS较高的情况。注: 在MySQL 5.5之前的版本中,默认的搜索
引擎是MyISAM,从MySQL 5.5之后的版本中,默认的搜索引擎变更为InnoDB。
MyISAM和InnoDB的区别:
InnoDB支持事务,MyISAM不支持。对于InnoDB每一条SQL语言都默认封装成事务,自动提交,这样会影
响速度,所以最好把多条SQL语言放在begin和commit之间,组成一个事务;
InnoDB支持外键,而MyISAM不支持。
InnoDB是聚集索引,使用B+Tree作为索引结构,数据文件是和(主键)索引绑在一起的(表数据文件本身
就是按B+Tree组织的一个索引结构),必须要有主键,通过主键索引效率很高。MyISAM是非聚集索引,也
是使用B+Tree作为索引结构,索引和数据文件是分离的,索引保存的是数据文件的指针。主键索引和辅助
索引是独立的。
InnoDB不保存表的具体行数,执行select count(*) from table时需要全表扫描。而MyISAM用一个变量
保存了整个表的行数,执行上述语句时只需要读出该变量即可,速度很快。
Innodb不支持全文索引,而MyISAM支持全文索引,查询效率上MyISAM要高;5.7以后的InnoDB支持全文
索引了。
InnoDB支持表、行级锁(默认),而MyISAM支持表级锁。
InnoDB表必须有主键(用户没有指定的话会自己找或生产一个主键),而Myisam可以没有。
Innodb存储文件有frm、ibd,而Myisam是frm、MYD、MYI。
Innodb:frm是表定义文件,ibd是数据文件。
Myisam:frm是表定义文件,myd是数据文件,myi是索引文件。