为什么需要日志?
把 MySQL 想象成一个健忘但精明的掌柜。他需要三个"神仙本本":
-
Redo Log (防断电备忘录) :生怕突然断电(宕机)后忘了刚完成的交易,MySQL会先飞快地记在这个本本上。这样重启后一看便知,保证生意一笔不落,这叫 持久性。
-
Undo Log (后悔药) :客人反悔不买了(事务回滚),掌柜就照着这个本本把东西恢复原样,好像无事发生。这保证了交易的"要么都做,要么都不做",这叫 原子性。
-
Binlog (监控录像):记录店里所有的操作流水。想开分店(主从复制)?把录像给分店照着做一遍就行。想恢复到昨天下午三点?拿出备份再播放录像到指定时间点。
没有这些日志,MySQL这位掌柜就会账目混乱,无法扩张,也经不起任何风浪。
Redo Log
想象一下,修改磁盘上的数据文件,就像是在一本已经精装成册的、厚重的书中修改一个错字。你得先找到那一页,小心翼翼地修改,这个过程非常缓慢(随机I/O性能差)。
为了不让用户(你)等得抓狂,MySQL 设计了一个"高效工作法":
-
"草稿纸" (Redo Log) :当你的
UPDATE
请求来了,MySQL 不会立刻去翻那本厚书。它会先在手边的"草稿纸"(Redo Log)上飞快地记下一笔。这个过程是顺序追加的,像写日记一样,速度极快(顺序I/O性能高)。 -
承诺先行 (WAL 技术) :只要写上了"草稿纸",MySQL 就立刻告诉你:"放心,我记下了,你的修改不会丢!" 这就是大名鼎鼎的 WAL (Write-Ahead Logging) 技术 ------"先写日志,再动正文"。
-
记录"动作"而非"命令" (物理日志) :"草稿纸"上记的不是"把某某数据更新一下"这种模糊命令,而是极其具体的" 将第X本书(表空间)第Y页(数据页)第Z行的内容改成D "。这种 物理日志 的好处是,恢复时无需思考,照着"动作"重做一遍即可,简单高效。
最终目的:即便 MySQL 突然断电,内存里的东西全忘了,也没关系。重启后,它只需拿出这张"草稿纸",检查哪些记录还没来得及誊写到"精装书"(磁盘文件)上,然后照着重做一遍,就能确保你的数据一个字节都不会少。
Undo Log
如果说 Redo Log 是保证"承诺必达"的英雄,那么 Undo Log 就是那位手持"后悔药"和"时光机"的魔法师,它主要解决两个问题:事务回滚 和 MVCC 并发控制。
事务回滚
你是一位在厚重精装书上修改错字的编辑。
-
Redo Log 记录的是:"准备把 '张三' 改成 '李四'"。
-
Undo Log 则在动手前,先在另一张便利贴上写下:"第 1024 页的第 3 行,改之前是'张三'"。
现在,你改到一半,老板突然说:"别改了,保持原样!"(ROLLBACK
操作)。
怎么办?你淡定地拿出那张写着"改之前是'张三'"的便利贴(Undo Log),轻松地把"李四"又改回了"张三"。一次完美的"反向操作"完成了!
总结:Undo Log 记录了数据修改前的"旧模样",是事务想反悔、执行 ROLLBACK
时的唯一依据,保证了事务的原子性(Atomicity)。
MVCC 并发控制
当你 (事务 A ) 正在那页书上涂涂改改,还没最后确认 COMMIT
时,另一位同事 (事务B) 跑过来说:"嘿,我现在想要看一下第 996 页的内容!"
如果没有 Undo Log 这个"时光机",同事** (事务 B) 要么只能看到你 (事务 A) 改得一塌糊涂的中间状态("脏读"),要么就得等你 (事务 A) **改完才能看(性能极差)。
这时,Undo Log 登场了!它会拦住同事B,把那张"改之前是'张三'"的便利贴递给他看。这样,同事 (事务 B) 读到的是你 (事务 A) 修改前那个"干净"的版本,而你也可以继续安心修改,互不干扰。
总结:通过为不同事务提供数据的"历史版本",Undo Log 实现了多版本并发控制(MVCC),让"读"和"写"可以同时进行,极大提高了数据库的并发性能。
Binlog
我们不应将 Binlog 简单视为一个"日志",而应看作是 MySQL Server 对外发布的 "操作纪要 ",它记录了所有导致数据变更的事件。它的两大核心使命是:主从复制 和 数据恢复。
主从复制
想象一下,主库(Master) 是总部,从库(Slave) 是遍布全球的加盟店。总部每完成一笔交易 (事务提交) ,就会在这份 "操作纪要" 上追加一条记录,并通过"内部专线"广播出去。加盟店基于这份纪要,一字不差地复刻总部的所有操作,从而保证全球业务同步,这便是 主从复制 的基石。
数据恢复
这更像是为数据库提供了一部可以回溯的"历史档案"。当有人(比如一个"手滑"的开发者)执行了错误的 DELETE
操作导致数据灾难时,Redo Log 无法救场(因为它只负责崩溃恢复)。
此时,管理员可以拿出昨天的完整备份,然后像历史学家一样,对照这份"历史档案"(Binlog),将从备份点到灾难发生前一秒的所有操作"重演"一遍,实现精准的 定点恢复(Point-in-Time Recovery)。