【MySQL】聊聊数据库是如何保证数据不丢的

对于一个存储系统来说，其中比较关键的核心组件包含，网络、存储模型、持久化、数据结构等。而数据如何保证不丢失，对于不同的存储系统来说，比如Redis采用AOF和RDB的方式进行混合使用，而MySQL采用日志进行保证。也就是redo\undo\bin log。本篇就聊聊数据库是如何进行不丢失的。

对于数据不丢失，其实就是针对更新语句（update\delete\insert）的操作流程，其中主要靠redo log保证恢复事务，undo log 回滚事务。

binlog在事务执行过程中，把日志写到binlog cache中，等事务提交的时候，再把binlog cache写到binlog中。而操作的维度就是一个事务。

系统给binlog cache分配了一片内存，每个线程一个。binlog_cache_size 控制单个线程内binlog cache所占内存的大小，超过之后，就暂存到磁盘中。

事务提交的时候，执行器把binlog cache里的完整事务写入到binlog中。并清空binlog cache

每个线程都有自己的binlog cache，但是对于bin log来说共用的。

决定执行write和fsync由sync_binlog参数决定。

其实就是在性能和可用性之间进行权衡，在时机中，一般都是设置成100-1000中的某个值。但是当系统发生宕机的时候，可能丢失N个事务的binlog 日志。

redo log是先写入redo log buffer-> page cache -> 磁盘

从而就对应三种写入状态

InnoDB 提供了 innodb_flush_log_at_trx_commit 参数，控制写入策略。

如图5就是将定时将脏页进行刷新操作。而对于bin log来说，是依靠每次事务提交的时候进行刷盘。

InnoDB由一个后台线程，间隔1S把redo log buffer中的日志，调用write写到文件系统的page cache，调用fscyn持久化到磁盘中。

所以这里可能存在一种情况，可能一个事务执行过程中，也可能被定时后台线程持久化到磁盘中。

日志逻辑序列号 log sequence number LSN 对应redo log的一个个写入点，每次写入长度为length的redo log LSN的值就会加上length。

图中有三个事务trx1、trx2、trx3 分别是50、120、160。

当trx1 第一个到达，提交的时候就会把2 3也一起进行提交fsync。所以一组提交的事务越多IOPS的效果越好。其实就是批处理的概念，一次多处理，而不是分批处理。比如批量插入SQL等，Kafka的批处理消息等。

WAL其实就只依赖于两个方面，redo log 和 bin log 都是顺序写，磁盘的顺序写比随机写快，另外一个是组提交，大幅度降低磁盘的IOPS消耗。