面试官:咳咳咳,看你简历写了精通Redis,那我就随便考考你吧😎
面试官:不用慌尽管说,错了也没关系😊。。。
面试官:我看你们项目用的Redis集群,数据同步了解吗
好的面试官。数据同步主要是利用了RDB文件来进行数据同步。
- 首先,从服务器会先向主服务器发送SYNC命令
- 收到命令后,主服务器会执行BGSAVE命令 来生成一个RDB文件 ,并使用AOF缓冲区来记录在生成期间执行的写命令
- 完成第二步后,主服务器会将RDB文件发送给从服务器,让从服务器同步RDB文件数据
- 当然这还没完,主服务器的AOF缓冲区还会发送给从服务器,让它们之间的数据同步至最终状态
面试官歪了歪脑袋,想了想...
面试官:按你这么说,数据同步后主服务器某个键删除了,数据又不同步了怎么办
噢噢好的。是这样的,Redis有一个叫命令传播的概念。
如果像面试官说的这种场景,再使用上面我提到的AOF缓冲区就有点浪费内存空间了。所以Redis会将主服务器的这条Del删除命令,发送给从服务器。
当从服务执行命令后,数据也就同步了。
面试官想:还知道命令传播,继续深入考你...
面试官:如果主从服务器断线呢?还是用的RDB来同步吗
不是的面试官。用的RDB来数据同步太消耗资源了,比如像CPU、内存、磁盘IO消耗。
如果是短时间断线,根本没有必要使用这么浪费资源的笨方法...
Redis它其实有一个叫PSYNC命令 ,主从服务器断线后,从服务器会发送一个PSYNC命令给主服务器。收到命令后主服务器会发送给从服务器断线期间执行的写命令。
这样从服务器执行命令后,它们的数据也就同步了。这种同步方式也叫部分重同步。
面试官思考中...
面试官:考你点深入些的,主服务器怎么知道断线期间执行了哪些命令呢
emmmmm我想想。
其实每个Redis节点都有维护一个复制偏移量 ,例如主从服务器的初始偏移量都是0,主服务器发送给从服务器N字节数据,主从服务器的偏移量就会+N。
通过这种形式来记录同步状态。
另外主服务器不是会进行命令传播 吗,同时它还会把命令传播的命令保存在一个有复制偏移量 标识的复制积压缓冲区队列。
所以从服务器发送PSYNC命令同时发送复制偏移量,主服务器只要根据复制偏移量在队列中找到对应的命令就可以了。
面试官想:可以的小伙子
面试官:你知道服务器运行ID吗
哦哦知道的,每个Redis节点都有自己的服务器运行ID。
当从服务器对主服务器进行初次复制 时,主服务器会将自己的运行ID传送给从服务器,而从服务器则会将这个运行ID保存起来。
当断线后数据同步时 ,从服务器将向当前连接的主服务器发送之前保存的运行ID。
如果此时主服务器发现从服务器发送的运行ID ,和自己的不一致。说明此时的主服务器是新的 主服务器,它也没有复制积压缓冲区 队列,也就不能进行部分重同步。
所以此时主服务器会向从服务器发送RDB文件来进行数据同步,服务器运行ID主要是这个作用。
面试官有点慌了不知道还能问啥...
面试官:Redis心跳检测知道吧
知道的,面试官。
从服务器默认会每秒一次向主服务器发送命令,如果主服务器超过1s没有收到replconf命令,说明主从服务器的网络连接有问题了。
js
REPLCONF ACK <replication_offset>
同时这个心跳检测命令还会附带传送一个复制偏移量 ,也就是replication_offset
。
如果心跳检测时,主服务器发现他们的复制偏移量不一致,就会通过该偏移量找到从服务器丢失的写命令,发送给从服务器保持同步。
心跳检测也有检测命令丢失的功能。
面试官抓抓脑袋,继续看你的简历......
得想想考点你不懂的😰
未完待续。。。。。。
好了,今天的分享就先到这,我们下期继续。
博主GitHub也有一些读者感兴趣的💪,GitHub戳这,你的 ⭐️ Star ⭐️,是作者的动力!
创作不易,不妨点赞、收藏、关注支持一下,各位的支持就是我创作的最大动力❤️