MySQL 知识点总结

专栏持续更新中：MySQL详解

前言

MySQL相信大家都耳熟能详了, 毕竟其还不错的性能和免费的特点深受国人的喜爱, 本篇文章将作为我《MySQL》系列的一篇文章, 主要用作整理和简单的概述MySQL相关的一些知识点

ok, 接下来我们开始进入正题, 从最简单的开始

关系型数据库和非关系型数据库

关系型数据库

关系型数据库是一个结构化的数据库, 创建在关系模型(二维表格模型)基础上, 一般面向于记录 SQL 语句就是一种基于关系型数据库的语言, 用于执行对关系型数据库中数据的检索和操作, 主流的关系型数据库包括: Oracle, MySQL, SQL Server等

本篇文章默认以 MySQL的 InnoDB引擎为主

非关系型数据库

非关系型数据库也叫 NoSQL, 采用键值对的形式进行存储. 一般来讲, 除了主流的关系型数据库之外的数据库, 都认为是非关系型

他的读写性能很高, 易于扩展, 主流的 NoSQL有: Redis, MongDB, Hbase等

适合使用的场景:

日志系统
数据量巨大
地理位置存储
高可用

关系型数据库与非关系型数据库之间的区别

关系型数据库:
- 采用了关系模型来组织数据, 容易理解
- 可以保持数据的一致性
- 数据更新的开销比较小
- 支持复杂查询(where子句等)
非关系型数据库
- 不需要经过 SQL层的解析, 读写效率高
- 基于键值对, 数据的扩展性很好
- 可以支持多种类型的数据的存储, 图片, 文档等

MySQL整体架构

SQL 的执行步骤

在 MySQL中, Server层按顺序执行SQL的步骤如下:

客户端请求
连接器(验证用户身份, 给与权限)
查询缓存(存在缓存则直接返回, 不存在则执行后续操作)
分析器(对SQL进行词法分析和语法分析操作)
优化器(主要对执行的 SQL优化选择最优的执行方案方法)
执行器(执行时会先看用户是否有执行权限, 有才去使用这个引擎提供的接口)
去引擎层获取数据返回(如果开启查询缓存则会缓存查询结果)

接下来我将按照 MySQL执行 SQL的步骤来进行讲解

MySQL 的架构图示

图1 展示了 MySQL各组件之间协同工作的逻辑视图, 也是一条SQL查询的执行流程, 接下来我主要围绕这张图来讲述一下他们和 MySQL之间的关系

图1 MySQL架构逻辑视图(图片来自于JavaGuide)

客户端的服务主要是包括连接处理, 身份验证, 确保安全性等. 大多数 MySQL的核心功能都在第二层, 包括查询解析, 分析, 优化, 以及所有的内置函数, 所有跨存储引擎的功能也都在这一层来实现: 存储过程, 触发器, 视图等

第三层是存储引擎层, 负责MySQL中数据的存储和提取. 其架构模式是插件式的, 支持 InnoDB, MyISAM, Memory等多个存储引擎, 现在最常用的存储引擎是 InnoDB, 在 MySQL 5.5版本之后成为了默认存储引擎

连接器

默认情况下, 每个客户端连接都会在服务器进程中拥有一个线程, 该连接的查询只会在这个线程中执行. 当客户端(应用)连接到 MySQL服务器时, 服务器需要对其进行身份验证, 身份验证基于用户名, 密码, 主机ip和端口号, 客户端连接成功之后, 服务器会继续验证该客户端的查询权限(例如, 是否有查看user库的权限, 是否允许对mysql库的user表进行SELECT)

创建新连接时身份验证基本信息

分析优化和执行

查询缓存

在执行一条 SELECT查询语句的时候会先去查询缓存看能否直接命中, 能命中就直接返回, 缓存中没有才会去进行下一步

只要表有更新操作, 那么这张表的缓存就会更新, 所以对于一张更新较\[\]频繁的表来说缓存命中是比较低的从 MySQL 5.7.20版本开始,

查询缓存已经被官方标注为废弃了, 8.0版本完全移除在 MySQL 8.0版本之前, 想关闭查询缓存可以将参数

query_cache_type 设置为 DEMADN

分析器

在该步骤主要进行两件事:

词法分析根据你的SQL语句识别出关键字来构建语法树, 方便后面的模块获取表名, 字段名, where条件等
语法分析根据词法分析结果, 语法分析会判断你输入的SQL语句是否满足 MySQL语法

优化器&执行器

在优化器中主要做了三件事:

prepare 预处理阶段:
- 查询 SQL中的表, 字段是否存在
- 将 select * 上的 * 扩列为所有列
optimize 优化阶段:
- 判断当前 SQL语句使用的索引类型, 主键索引, 普通索引, 覆盖索引, 全表扫描等
execute 执行阶段:
- 根据优化结果执行 SQL查询, 从存储引擎中获取查询结果并返回

优化器并不关心查询引擎类型, 但是存储引擎对于查询优化是有影响的.

存储引擎

在 MySQL中, 可以使用 show engines命令来查询 MySQL支持的所有存储引擎

可以看到, 当前默认存储引擎是InnoDB, 同时只有InnoDB是支持事务的

MyISAM和InnoDB的区别

老生常谈了, 也是面试高频考点

	MyISAM	InnoDB
行级锁	只有表级锁支	持行级锁和表级锁, 默认为行级锁
事务	不支持事务	实现了四个隔离级别, 具有提交和回滚事务的能力, 默认使用 REPEATABLE-READ（可重读）隔离级别是可以解决幻读问题发生的
外键	不支持	支持, 在阿里的<java开发手册>中是不推荐使用外键的
异常崩溃后的安全恢复	不支持	支持, redo log
MVCC	不支持	支持

事务

事务的四大特性

原子性: 一个事务中的数据操作, 要么全部成功, 要么全部失败并回滚到执行之前的状态
一致性: 事务操作前后, 数据满足完整性约束, 数据库保持一致性状态
隔离性: 事务之间相互隔离, 互不影响, 每个事务都有一个完整的数据空间, 在一个事务结束之前对其他事务来讲应该是不存在的
持久化: 事务结束之后, 对数据的操作即为永久的, 即便系统故障也不会消失

隔离级别

未提交读 (READ UNCOMMITTED): 在事务中可以查看其他事务未提交的修改
- 读取未提交的事务也叫脏读
读提交 (READ COMMITTED):一个事务可以看到其他事务在他开始之后提交的修改
- 同一个事务两次执行相同语句可能会看到不同的数据结果, 不可重复读
M可重复读(REPEATABLE READ): 同一个事务在多次读取相同行数据的结果相同
- 当一个事务执行范围查询过程中, 另外一个事务对该范围进行了插入操作, 当再次对该范围进行查询的时候, 就会出现幻行, 也就是幻读
串行化(SERIALIZABLE):最高的事务隔离级别, 解决了幻读问题. 其会在读取的每一行数据都进行加锁操作

多个事务之间引发的隔离问题

脏读: 读取未提交的事务
不可重复读: 同一个事务两次执行相同语句可能会看到不同的数据结果
幻读: 当一个事务执行范围查询过程中, 另外一个事务对该范围进行了插入操作, 当再次对该范围进行查询的时候, 就会出现幻行