MySQL 学习笔记（运维篇1）

一、日志

1. 错误日志

(1) 错误日志是 MySQL 中最重要的日志之一，它记录了当 mysqld 启动和停止时，以及服务器在运行过程中发生任何严重错误时的相关信息当数据库出现任何故障导致无法正常使用时，建议首先查看此日志。

(2) 该日志是默认开启的，默认存放目录 /var/log/，默认的日志文件名为 mysqld.log 。查看日志位置：

bash 复制代码

show variables like '%log_error%'

2. 二进制日志

(1) 二进制日志(BINLOG)记录了所有的 DDL(数据定义语言)语句和 DML(数据操纵语言)语句，但不包括数据查询(SELECT、SHOW)语句。

(2) 作用：

① 灾难时的数据恢复；

② MySQL的主从复制。

在MySQL8版本中，默认二进制日志是开启着的，涉及到的参数如下：

bash 复制代码

show variables like '%log_bin%'

(3) 日志格式

MySQL服务器中提供了多种格式来记录二进制记录，具体格式及特点如下：

日志格式	含义
statement	基于SQL语句的日志记录，记录的是SQL语句，对数据进行修改的SQL都会记录在日志文件中。
row	基于行的日志记录，记录的是每一行的数据变更。(默认)
mixed	混合了STATEMENT和ROW两种格式，默认采用STATEMENT，在某些特殊情况下会自动切换为ROW进行记录。

查看参数方式：

bash 复制代码

show variables like '%binlog_format%';

(4) 日志查看

由于日志是以二进制方式存储的，不能直接读取，需要通过二进制日志查询工具 mysqlbinlog 来查看，具体语法：

bash 复制代码

mysqlbinlog[参数选项]logfilename

参数选项：
    -d    指定数据库名称，只列出指定的数据库相关的操作。
    -o    忽略掉日志中的前n行命令。
    -v    将行事件(数据变更)重构为SOL语句。
    -vv    将行事件(数据变更)重构为SQL语句，并输出注释信息

(5) 日志删除

对于比较繁忙的业务系统，每天生成的binlog数据巨大，如果长时间不清除，将会占用大量磁盘空间。可以通过以下几种方式清理日志：

指令	含义
reset master	删除全部 binlog 日志，删除之后，日志编号，将从 binlog.000001重新开始
purge master logs to 'binlog.***'	删除 *** 编号之前的所有日志
purge master logs before 'yyyy-mm-dd hh24:mi:ss'	删除日志为"yyyy-mm-dd hh24:mi:ss"之前产生的所有日志

也可以在mysql的配置文件中配置二进制日志的过期时间，设置了之后，二进制日志过期会自动删除。

bash 复制代码

show variables like '%binlog_expire_logs_seconds%'

3. 查询日志

(1) 查询日志中记录了客户端的所有操作语句，而二进制日志不包含查询数据的SQL语句。默认情况下，查询日志是未开启的。如果需要开启查询日志，可以设置一下配置：

修改MySQL的配置文件 /etc/my.cnf 文件，添加如下内容：

bash 复制代码

#该选项用来开启查询日志，可选值：0或者1；0代表关闭，1代表开启
general_log=1
#设置日志的文件名 ， 如果没有指定，默认的文件名为 host_name.log
general_log_file=mysql_query.log

4. 慢查询日志

(1) 慢查询日志记录了所有执行时间超过参数 long_query_time 设置值并且扫描记录数不小于 min_examined_row_limit的所有的SQL语句的日志，默认未开启。long_query_time 默认为 10 秒，最小为0，精度可以到微秒。

bash 复制代码

#慢查询日志
slow_query_log=1
#执行时间参数
long_query_time=2

(2) 默认情况下，不会记录管理语句，也不会记录不使用索引进行查找的查询。可以使用log_slow_admin_statements和更改此行为log_queries_not_using_indexes，如下所述。

bash 复制代码

#记录执行较慢的管理语句
log_slow_admin_statements = 1
#记录执行较慢的未使用索引的语句
log_queries_not_using_indexes = 1

二、主从复制

1. 概述

(1) 主从复制是指将主数据库的 DDL 和 DML 操作通过二进制日志传到从库服务器中，然后在从库上对这些日志重新执行（也叫做重做），从而使得从库和主库的数据保持同步。

(2) MySQL 支持一台主库同时向多台从库进行复制，从库同时也可以作为其他服务器的主库，实现链式复制。

(3) MySQL 复制的优点主要包含以下三个方面：

① 主库出现问题，可以快速切换到从库提供服务。

② 实现读写分离，降低主库的访问压力。

③ 可以在从库中执行备份，以避免备份期间影响主服务器。

2. 原理

从上图来看，复制分成三步：

(1) Master 主库在事务提交时，会把数据变更记录在二进制日志文件 Binlog 中。

(2) 从库读取主库的二进制日志文件 Binlog，写入到从库的中继日志 Relay log。

(3) slave 重做中继日志中的事件，将改变反映它自己的数据。

3. 搭建

4. 主库配置

(1) 修改配置文件 /etc/my.cnf

bash 复制代码

#mysql 服务ID，保证整个集群环境中唯一，取值范围：1 - 2^32-1，默认为1
server-id=1
#是否只读 1代表只读，0代表读写
read-only=0
#忽略的数据库，指不需要同步的数据库
#binlog-ignore-db=mysql
#指定同步的数据库
#binlog-do-db=db01

(2) 重启 MySQL 服务器

bash 复制代码

systemctl restart mysqld

(3) 登录 mysql，创建远程连接的账号，并授予主从复制权限

bash 复制代码

#创建itcast用户，并设置密码，该用户可在任意主机连接该MySQL服务
CREATE USER 'itcast'@'%' IDENTIFIED WITH mysql_native_password BY 'Root@123456';
#为'itcast'@'%'用户分配主从复制权限
GRANT REPLICATION SLAVE ON *.* TO 'itcast'@'%';

(4) 通过指令，查看二进制日志坐标

bash 复制代码

show master status;

字段含义说明：

file：从哪个日志文件开始推送日志文件

position：从哪个位置开始推送日志

binlog_ignore_db：指定不需要同步的数据库

5. 从库配置

(1) 修改配置文件 /etc/my.cnf

bash 复制代码

#mysql服务ID，保证整个集群环境中唯一，取值范围：1 - 2^32-1，和主库不一样即可
server-id=2
#是否只读：1代表只读，0代表读写
read-only=1

(2) 重新启动 MySQL 服务

bash 复制代码

systemctl restart mysqld

(3) 登录 mysql，设置主库配置

bash 复制代码

CHANGE REPLICATION SOURCE TO SOURCE_HOST='xxx', SOURCE_USER='xxx', SOURCE_PASSWORD='xxx', SOURCE_LOG_FILE='xxx', SOURCE_LOG_POS=xxx;

上述是 8.0.23 中的语法。如果 mysql 是 8.0.23 之前的版本，执行如下 SQL：

bash 复制代码

CHANGE MASTER TO MASTER_HOST='xxx.xxx.xxx.xxx', MASTER_USER='xxx', MASTER_PASSWORD='xxx', MASTER_LOG_FILE='xxx', MASTER_LOG_POS=xxx;

参数名	含义	8.0.23 之前
SOURCE_HOST	主库 IP 地址	MASTER_HOST
SOURCE_USER	连接主库的用户名	MASTER_USER
SOURCE_PASSWORD	连接主库的密码	MASTER_PASSWORD
SOURCE_LOG_FILE	binlog 日志文件名	MASTER_LOG_FILE
SOURCE_LOG_POS	binlog 日志文件位置	MASTER_LOG_POS

(4) 开启同步操作

bash 复制代码

start replica ;  #8.0.22之后
start slave ;    #8.0.22之前

(5) 查看主从同步状态

bash 复制代码

show replica status ;  #8.0.22之后
show slave status ;    #8.0.22之前

6. 测试

(1) 在主库上创建数据库、表，并插入数据

sql 复制代码

create database db01;
use db01;
create table tb_use(
	id int(11) primary key not null auto_increment,
	name varchar(50) not null,
	sex varchar(1)
)engine=innodb default charset=utf8mb4;
insert into tb_user(id, name, sex) valurs (null, 'Tom', '1'), (null, 'Trigger', '0'), (null, 'Dawn', '1');

(2) 在从库中查询数据，验证主从是否同步。

三、分库分表

1. 介绍

(1) 问题分析

随着互联网及移动互联网的发展，应用系统的数据量也是成指数式增长，若采用单数据库进行数据存储，存在以下性能瓶颈：

① I/O 瓶颈：热点数据太多，数据库缓存不足，产生大量磁盘 I/O，效率较低。请求数据太多，带宽不够，网络 I/O 瓶颈。

② CPU 瓶颈：排序、分组、连接查询、聚合统计等 SQL 会耗费大量的 CPU 资源，请求数太多，CPU 出现瓶颈。

分库分表的中心思想都是将数据分散存储，使得单一数据库 / 表的数据量变小来缓解单一数据库的性能问题，从而达到提升数据库性能的目的。

(2) 拆分策略

(3) 垂直拆分

① 垂直分库

以表为依据，根据业务将不同表拆分到不同库中。

特点：

每个库的表结构都不一样。
每个库的数据也不一样。
所有库的并集是全量数据。

② 垂直分表

以字段为依据，根据字段属性将不同字段拆分到不同表中。

特点：

每个表的结构都不一样。
每个表的数据也不一样，一般通过一列（主键 / 外键）关联。
所有表的并集是全量数据。

(4) 水平拆分

① 水平分库

以字段为依据，按照一定策略，将一个库的数据拆分到多个库中。

特点：

每个库的表结构都一样。
每个库的数据都不一样。
所有库的并集是全量数据。

② 水平分表

以字段为依据，按照一定策略，将一个表的数据拆分到多个表中。

特点：

每个表的表结构都一样。
每个表的数据都不一样。
所有表的并集是全量数据。

2. Mycat 入门

(1) 安装

Mycat 是采用 java 语言开发的开源的数据库中间件，支持 Windows 和 Linux 运行环境，下面介绍 Mycat 在 Linux 中的环境搭建，我们需要在准备好的服务器中安装如下软件。

MySQL
JDK
Mycat

服务器	安装软件	说明
192.168.200.210	JDK、Mycat	Mycat 中间件服务器
192.168.200.210	MySQL	分片服务器
192.168.200.213	MySQL	分片服务器
192.168.200.214	MySQL	分片服务器

(2) 概念介绍

(3) 需求

由于 tb_order 表中数据量很大，磁盘 IO 及容量都到达了瓶颈，现在需要对 tb_order 表进行数据分片，分为三个数据节点，每一个节点主机位于不同的服务器上，具体的结构，参考下图：

(4) 分片配置

(5) 启动服务

切换到 Mycat 的安装目录，执行如下指令，启动 Mycat：

bash 复制代码

#启动
bin/mycat start
#停止
bin/mycat stop

Mycat 启动之后，占用端口号 8066。

启动完毕之后，可以查看 logs 目录下的启动日志，查看 Mycat 是否启动完成。

(6) 分片测试

① 通过如下指令，就可以连接并操作 Mycat。

bash 复制代码

mysql -h 192.168.200.210 -P 8066 -uroot -p123456

② 然后就可以在 Mycat 中创建表，并往结构中插入数据，查看数据在 MySQL 中的分布情况。

sql 复制代码

CREATE TABLE TB_ORDER(
  id BIGINT(20) NOT NULL,
  title VARCHAR(100) NOT NULL,
  PRIMARY KEY (id)
)ENGINE=INNODB DEFAULT CHARSET=utf8;

INSERT INTO TB_ORDER(id,title) VALUES(1,'goods1');
INSERT INTO TB_ORDER(id,title) VALUES(2,'goods2');
INSERT INTO TB_ORDER(id,title) VALUES(3,'goods3');
INSERT INTO TB_ORDER(id,title) VALUES(1000000,'goods1000000');
INSERT INTO TB_ORDER(id,title) VALUES(10000000,'goods10000000');

3. MyCat 配置

(1) schema.xml

schema.xml作为MyCat中最重要的配置文件之一,涵盖了MyCat的逻辑库、逻辑表、分片规则、分片节点及数据源的配置。

主要包含以下三组标签：

schema标签
datanode标签
datahost标签

① schema标签（第一行）

XML 复制代码

<schema name="DB01" checkSQLschema="true" sqlMaxLimit="100" >
    <table name="TB_ORDER" dataNode="dn1,dn2,dn3" rule="auto-sharding-long" />
</schema>

schema 标签用于定义 MyCat 实例中的逻辑库，一个 MyCat 实例中，可以有多个逻辑库，可以通过 schema 标签来划分不同的逻辑库。

MyCat 中的逻辑库的概念，等同于 MySQL 中的 database 概念，需要操作某个逻辑库下的表时，也需要切换逻辑库 (use xxx)。

核心属性：

name：指定自定义的逻辑库库名
checkSQLschema：在 SQL 语句操作时指定了数据库名称，执行时是否自动去除；true：自动去除，false：不自动去除
sqlMaxLimit：如果未指定 limit 进行查询，列表查询模式查询多少条记录

② table 标签

XML 复制代码

<schema name="DB01" checkSQLschema="true" sqlMaxLimit="100" >
    <table name="TB_ORDER" dataNode="dn1,dn2,dn3" rule="auto-sharding-long" />
</schema>

table 标签定义了 MyCat 中逻辑库 schema 下的逻辑表，所有需要拆分的表都需要在 table 标签中定义。

核心属性：

name：定义逻辑表表名，在该逻辑库下唯一
dataNode：定义逻辑表所属的 dataNode，该属性需要与 dataNode 标签中 name 对应；多个 dataNode 逗号分隔
rule：分片规则的名字，分片规则名字是在 rule.xml 中定义的
primaryKey：逻辑表对应真实表的主键
type：逻辑表的类型，目前逻辑表只有全局表和普通表，如果未配置，就是普通表；全局表，配置为 global

③ dataNode 标签

XML 复制代码

<dataNode name="dn1" dataHost="dhost1" database="db01" />
<dataNode name="dn2" dataHost="dhost2" database="db01" />
<dataNode name="dn3" dataHost="dhost3" database="db01" />

dataNode 标签中定义了 MyCat 中的数据节点，也就是我们通常说的数据分片。一个 dataNode 标签就是一个独立的数据分片。

核心属性：

name：定义数据节点名称
dataHost：数据库实例主机名称，引用自 dataHost 标签中 name 属性
database：定义分片所属数据库

④ dataHost 标签

XML 复制代码

<dataHost name="dhost1" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="jdbc">
    <heartbeat>select user()</heartbeat>
    <writeHost host="master" url="jdbc:mysql://192.168.200.210:3306?useSSL=false&amp;serverTimezone=Asia/Shanghai&amp;characterEncoding=utf8"
        user="root" password="1234">
    </writeHost>
</dataHost>

核心属性：

name：唯一标识，供上层标签使用
maxCon/minCon：最大连接数 / 最小连接数
balance：负载均衡策略，取值 0,1,2,3
writeType：写操作分发方式（0：写操作转发到第一个 writeHost，第一个挂了，切换到第二个；1：写操作随机分发到配置的 writeHost）
dbDriver：数据库驱动，支持 native、jdbc

(2) rule.xml

rule.xml 中定义所有分表的规则，在使用过程中可以灵活的使用分片算法，或者对同一个分片算法使用不同的参数，它让分片过程可配置化。主要包含两类标签：tableRule、function。

(3) server.xml

① system 标签

XML 复制代码

<system>
    <property name="nonePasswordLogin">0</property>
    <property name="useHandshakeV10">1</property>
    <property name="useSqlStat">1</property>
</system>

② user 标签