CLUSTER MEET
过程说明
client Node A Node B cmd: cluster meet B_ip B_port [B_cport] Invalid node address specified: ip:port OK alt [ip or port or cport is invalid] clusterCron message1: MEET message2: PONG handshake completed clusterCron message3: PING message4: PONG handshake completed client Node A Node B
注意:B_ip 不能使用域名
Node A 收到client发送的meet命令后:
- 如果 B_cport 不存在,则 B_cport = B_port + 10000
- 检查 B_ip, B_port, B_cport 的合法性
- 在自己的cluster节点字典中查找是否存在这样的节点
- 处于handshake状态 &&
- ip == B_ip &&
- port == B_port &&
- cport == B_cport
如果存在,说明相同的节点已经处于handshake阶段,不需要重复handshake,返回OK给client。
- 新建实体B:
- 生成一个随机节点ID
- 设置创建时间为当前时间
- 添加标记: NODE_HANDSHAKE | NODE_MEET
- 设置传入的 ip, port, cport
- 把实体B加入到自己的cluster节点字典
- 返回OK给client
clusterCron: 一个专门处理cluster间通信的周期性调度。
消息说明
以下执行步骤只挑选了主要的步骤。
message1:A meet B
Node A 在ClusterCron时:
- 检查B是否存在NODE_MEET标记,没有则返回
- 判断跟B的handshake是否已经timeout:
当前时间 - 节点的创建时间 > max(cluster-node-timeout, 1000)
(cluster-node-timeout 是配置项) - 如果timeout了,从cluster节点字典中删除B的信息并返回
- 检查是否存在指向Node B的link,如果没有则创建一个(方向为TO)
- 连通后发送message1(MEET)给Node B
- 从实体B中移除NODE_MEET标记
message2:B pong A
Node B在收到message1后:
- 如果没有配置 cluster-announce-ip,则从socket中查找自己的ip
- 新建实体A
- 生成一个随机节点ID
- 设置创建时间为当前时间
- 通过socket查找Node A的ip
- 添加标记: NODE_HANDSHAKE
- 设置传入的 ip, port, cport
- 把实体A加入到cluster节点字典
- 处理消息中的gossip部分
- 回复message2(PONG)给Node A
- 到此,在Node B看来,还没有完成跟Node A的handshake,所以不会直接使用message1中Node A的ID,也不会更新A的slots分布
Node A在收到message2后:
- 从message2 中获取Node B的ID,更新实体B。因为之前新建实体B时用的是随机ID,而这次message2中带的才是真正的ID,所以需要更新
- 移除实体B中的HANDSHAKE标记
- 根据message2中的信息设置实体B为master或者slave
- 到此,在A看来,已完成跟B的handshake过程。但此时A还没有获取B中的slots分布。handshake完成后的下一次ping/pong才会更新slots。
message3:B ping A
Node B 在ClusterCron时:
- 检查是否存在指向Node A的link,没有则创建一个(方向为TO)
- 连通后发送message3(PING)给Node A
Node A在收到message3后:
- 更新currentEpoch和configEpoch
- 如果没有配置 cluster-announce-ip,则从socket中查找自己的ip
- 回复message4(PONG)给Node B
- 更新实体B中slots的分布
- 处理gossip和extension部分
message4: A pong B
Node B在收到message4后:
- 从message4 中获取Node A的ID,更新实体A。因为之前新建实体A时用的是随机ID,而这次message4中带的才是真正的ID,所以需要更新
- 移除实体A中的HANDSHAKE标记
- 根据message4中的信息设置实体B为master或者slave
- 到此,在B看来,已完成跟A的handshake过程。但此时B还没有获取A中的slots分布。handshake完成后的下一次ping/pong才会更新slots。
至此:
-
当Node A和Node B都完成了handshake过程后,就会进入相互ping/pong/update等的阶段
-
而Node B可以从Node A的ping/pong中获取到Node A的slots分布,从而更新到实体A
-
只有handshake成功后的下一次ping/pong才会真正的更新自己cluster节点字典中的实体。
Demo
Node A的日志
shell
# Step 1
# Node A向Node B发送message1(MEET),fe4d****这个ID是实体B随机生成的
3383:M 22 Nov 2022 15:02:45.098 . Connecting with Node fe4d416c13a24d5dc03a6fff25181d3ae15f95ad at 127.0.0.1:17000
# -----------------
# Step 3
# Node A收到Node B回复的message2(PONG)
3383:M 22 Nov 2022 15:02:45.099 . --- Processing packet of type pong, 2256 bytes
3383:M 22 Nov 2022 15:02:45.099 . pong packet received: fe4d416c13a24d5dc03a6fff25181d3ae15f95ad
# 根据message2里面Node B的真实ID,更新实体B
3383:M 22 Nov 2022 15:02:45.099 . Renaming node fe4d416c13a24d5dc03a6fff25181d3ae15f95ad into 737418730813700da2f51ddeb8bdc8e3fd2a7805
# 在Node A看来,跟Node B的handshake过程结束
3383:M 22 Nov 2022 15:02:45.099 . Handshake with node 737418730813700da2f51ddeb8bdc8e3fd2a7805 completed.
# -----------------
# Step 5
# Node A收到Node B发送来的message3(PING)
3383:M 22 Nov 2022 15:02:45.201 - Accepting cluster node connection from 127.0.0.1:56990
3383:M 22 Nov 2022 15:02:45.201 . --- Processing packet of type ping, 2256 bytes
# Node A 修正自己的IP
3383:M 22 Nov 2022 15:02:45.201 # IP address for this node updated to 127.0.0.1
# Node A根据message3,做一系列操作,包括更新实体B中的slots
3383:M 22 Nov 2022 15:02:45.201 . ping packet received: 737418730813700da2f51ddeb8bdc8e3fd2a7805
# Node A回复message4给Node B(日志没显示)
# -----------------
# Step 8
# Node A再次收到Node B发送来的PING
3383:M 22 Nov 2022 15:02:45.303 . --- Processing packet of type ping, 2256 bytes
3383:M 22 Nov 2022 15:02:45.303 . ping packet received: 737418730813700da2f51ddeb8bdc8e3fd2a7805
# Node A回复PONG给Node B(日志没显示)
# -----------------
Node B的日志
shell
# Step 2
# Node B收到NodeA发送来的message1
3372:M 22 Nov 2022 15:02:45.099 - Accepting cluster node connection from 127.0.0.1:44968
3372:M 22 Nov 2022 15:02:45.099 . --- Processing packet of type meet, 2256 bytes
# Node B修正自己的IP
3372:M 22 Nov 2022 15:02:45.099 # IP address for this node updated to 127.0.0.1
# 因为message1中Node A的ID在Node B的cluster节点字典中不存在对应的实体,所以received打印的是NULL
3372:M 22 Nov 2022 15:02:45.099 . meet packet received: NULL
# Node B回复message2给Node A(日志没显示)
# -----------------
# Step 4
# Node B在clusterCron时向NodeA发送message3(PING)
3372:M 22 Nov 2022 15:02:45.201 . Connecting with Node ba747dfdcd40d974294054f1d7ca023678ff9874 at 127.0.0.1:16000
# -----------------
# Step 6
# Node B收到Node A回复的message4(PONG)
3372:M 22 Nov 2022 15:02:45.204 . --- Processing packet of type pong, 2256 bytes
3372:M 22 Nov 2022 15:02:45.204 . pong packet received: ba747dfdcd40d974294054f1d7ca023678ff9874
# Node B根据message4中Node A的真实ID,更新实体A
3372:M 22 Nov 2022 15:02:45.204 . Renaming node ba747dfdcd40d974294054f1d7ca023678ff9874 into ea017e0f83612b1b32179b4277becba349db5590
# 在Node B看来,跟Node A的handshake过程结束
3372:M 22 Nov 2022 15:02:45.204 . Handshake with node ea017e0f83612b1b32179b4277becba349db5590 completed.
# -----------------
# Step 7
# Node B在clusterCron时再次向Node A发送PING消息
3372:M 22 Nov 2022 15:02:45.303 . Pinging node ea017e0f83612b1b32179b4277becba349db5590
# -----------------
# Step 9
# Node B收到Node A回复的PONG
3372:M 22 Nov 2022 15:02:45.303 . --- Processing packet of type pong, 2256 bytes
# Node B根据PONG,做一系列操作,包括更新实体A中的slots
3372:M 22 Nov 2022 15:02:45.303 . pong packet received: ea017e0f83612b1b32179b4277becba349db5590