AOF介绍
- Append Only File
- 以日志的形式来记录每个写操作(增量保存),将Redis执行过的所有写指令记录下来(读操作不记录),只许追加文件但不可以改写文件
- redis启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作
AOF持久化流程
- 客户端的请求写命令会被append追加到AOF缓冲区内
- AOF缓冲区根据AOF持久化策略[always,everysec,no]将操作sync同步到磁盘的AOF文件中
- AOF文件大小超过重写策略或手动重写时,会对AOF文件rewrite重写,压缩AOF文件容量
- Redis服务重启时,会重新load加载AOF文件中的写操作达到数据恢复的目的

AOF默认不开启
- redis.conf中配置文件名称,默认为 appendonly.aof
- AOF文件的保存路径,同RDB的路径一致
AOF和RDB同时开启
- AOF和RDB同时开启,系统默认取AOF的数据(数据不会存在丢失)
AOF启动/修复/恢复
- 备份操作
- AOF的备份机制和性能虽然和RDB不同, 但是备份和恢复的操作同RDB一样,都是拷贝备份文件,需要恢复时再拷贝到Redis工作目录下,启动系统即加载
- 正常恢复
- 修改配置文件默认的appendonly no,改为yes
- 将有数据的aof文件复制一份保存到对应目录(查看目录:config get dir)
- 恢复:重启redis然后重新加载
- 异常恢复
- 修改默认的appendonly no,改为yes
- 如遇到AOF文件损坏,通过/usr/local/bin/路径下的redis-check-aof --fix appendonly.aof命令进行恢复
- 备份被写坏的AOF文件
- 恢复:重启redis,然后重新加载

AOF同步频率
- appendfsync always
- appendfsync everysec
- appendfsync no
Rewrite压缩
- 重写概念
- AOF采用文件追加方式,文件会越来越大为避免出现此种情况,新增了重写机制
- 当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩, 只保留可以恢复数据的最小指令集
- 可以使用命令bgrewriteaof
- 重写原理
- AOF文件持续增长而过大时,会fork出一条新进程来将文件重写(也是先写临时文件最后再rename)
- redis4.0版本后的重写,实际上就是把rdb 的快照,以二级制的形式附在新的aof头部,作为已有的历史数据,替换掉原来的流水账操作
- no-appendfsync-on-rewrite
- no-appendfsync-on-rewrite=yes ,不写入aof文件只写入缓存,用户请求不会阻塞,但是在这段时间如果宕机会丢失这段时间的缓存数据(降低数据安全性,提高性能)
- no-appendfsync-on-rewrite=no, 还是会把数据往磁盘里刷,但是遇到重写操作,可能会发生阻塞(数据安全,但是性能降低)
- 重写的触发
- Redis会记录上次重写时的AOF大小,默认配置是当AOF文件大小是上次rewrite后大小的一倍且文件大于64M时触发
- 重写虽然可以节约大量磁盘空间,减少恢复时间。但是每次重写还是有一定的负担的,因此设定Redis要满足一定条件才会进行重写
- auto-aof-rewrite-percentage:设置重写的基准值,文件达到100%时开始重写(文件是原来重写后文件的2倍时触发)
- auto-aof-rewrite-min-size:设置重写的基准值,最小文件64MB。达到这个值开始重写
例如:文件达到70MB开始重写,降到50MB,下次什么时候开始重写?100MB
系统载入时或者上次重写完毕时,Redis会记录此时AOF大小,设为base_size
如果Redis的AOF当前大小>= base_size +base_size*100% (默认)且当前大小>=64mb(默认)的情况下,Redis会对AOF进行重写
- 重写流程
- bgrewriteaof触发重写,判断是否当前有bgsave或bgrewriteaof在运行,如果有,则等待该命令结束后再继续执行
- 主进程fork出子进程执行重写操作,保证主进程不会阻塞
- 子进程遍历redis内存中数据到临时文件,客户端的写请求同时写入aof_buf缓冲区和aof_rewrite_buf重写缓冲区,保证原AOF文件完整以及新AOF文件生成期间的新的数据修改动作不会丢失
- 子进程写完新的AOF文件后,向主进程发信号,父进程更新统计信息,主进程把aof_rewrite_buf中的数据写入到新的AOF文件
- 使用新的AOF文件覆盖旧的AOF文件,完成AOF重写

优点
- 备份机制更稳健,丢失数据概率更低
- 可读的日志文本,通过操作AOF稳健,可以处理误操作
缺点
- 比起RDB占用更多的磁盘空间,恢复备份速度要慢
- aof运行效率要慢于rdb,每秒同步策略效率较好,不同步效率和rdb相同
- 每次读写都同步的话,有一定的性能压力
- 存在个别Bug,造成不能恢复
RDB和AOF总结
- RDB持久化方式能够在指定的时间间隔对数据进行快照存储
- AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以redis协议追加,保存每次写的操作到文件末尾。Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大
- 只做缓存的情况:如果数据只需要在服务器运行的时候存在,也可以不使用任何持久化方式
- 二者同时开启时,redis重启的时候会优先载入AOF文件来恢复原始的数据, 因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整
- RDB更适合用于备份数据库(AOF在不断变化不好备份), 快速重启,而且RDB不会有AOF可能潜在的bug,可以作为一个备份的手段
RDB和AOF性能
- RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则
- 如果Enable AOF
- 好处是在最恶劣的环境下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了
- 代价一是带来了持续的IO,二是AOF Rewrite 的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的
- 只要硬盘许可,应该尽可能减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设置到5G以上。默认超过原大小100%时重写可以改到适当的数值
- 如果不Enable AOF
- 仅靠Master-Slave Replication实现高可用性也可以。能省掉一大笔IO也减少了rewrite时带来的系统波动
- 代价是如果Master / Slave同时倒掉,会丢失十几分钟的数据,启动脚本也要比较两个 Master / Slave 中的RDB文件,载入较新的那个。新浪就用了这种架构