系列文章
Hazelcast系列(四):Auto-Detection发现机制
目录
前言
如果是通信环境比较复杂,在外网或者安全性不高的网络通信的情况下,Multicast 可能不是首选,那么,这里就可以采用 TCP/IP 集群配置的方式。
当将 Hazelcast 配置为通过 TCP/IP 发现成员时,必须将成员的主机名和/或 IP 地址的全部或子集列出为集群成员。TCP/IP 不必列出所有这些集群成员,但当新成员加入时,所列出的成员中至少有一个必须在集群中处于活动状态。
配置
- XML
XML
<hazelcast>
...
<network>
<join>
<tcp-ip enabled="true">
<member-list>
<member>machine1</member>
<member>machine2</member>
<member>machine3:5799</member>
<member>192.168.1.0-7</member>
<member>192.168.1.21</member>
</member-list>
</tcp-ip>
</join>
</network>
...
</hazelcast>
- YAML
java
hazelcast:
network:
join:
tcp-ip:
enabled: true
member-list:
- machine1
- machine2
- machine3:5799
- 192.168.1.0-7
- 192.168.1.21
注意:
- 这里TCP/IP enabled 为 true 后,其他的发现方式需要设置为false,尤其是默认的发现方式
- machine1、machine2、machine3 等名称可以是 主机名 或者 IP地址
- member-list 中每个成员,可以设置范围,但是必须要配置至少一个存活的成员
- 可以不配置端口,Hazelcast 会自动尝试端口 5701、5702
配置元素
- enabled:指定是否启用 TCP/IP 发现。值可以是true或false。
- required-member:所需成员的IP地址。仅当找到具有该 IP 地址的成员时才会形成集群。
- member-list:一位或多位集群成员的 IP 地址。一旦会员连接到这些众所周知的地址,所有成员地址就会相互通信。这里还可以使用members元素给出以逗号分隔的 IP 地址。
- connection-timeout-seconds:定义连接超时(以秒为单位)。这是 Hazelcast 在放弃之前尝试连接到成员的最长时间。将其设置为太低的值可能意味着成员无法连接到集群。将其设置为过高的值意味着成员启动可能会因超时较长而变慢,例如当集群成员未启动时。如果列出了许多 IP 并且成员无法正确构建集群,建议增加此值。它的默认值为 5 秒。
其他
- 默认情况下,Hazelcast 绑定到所有本地网络接口以接受传入流量。可以使用系统属性更改此行为hazelcast.socket.bind.any。如果将此属性设置为 false,Hazelcast 将使用元素中指定的接口 interfaces 。如果未提供接口,则它会尝试解析一个接口以从member 元素 绑定。
java
System.setProperty("hazelcast.socket.bind.any", "false");
- TCP/IP 在网络情况不好的情况下,发现成员时 或者 脑裂恢复会有一个集群成员合并的过程,这里可以通过设置两个参数:
- hazelcast.merge.first.run.delay.seconds:分裂或者合并在服务初始后多久开始,默认300,单位秒
- hazelcast.merge.next.run.delay.seconds:分裂或者合并过程的运行间隔,默认120,单位秒
java
System.setProperty("hazelcast.merge.first.run.delay.seconds", "300");
System.setProperty("hazelcast.merge.next.run.delay.seconds", "120");
- TCP/IP 发现成员IP可以配置为 负载均衡的服务器IP 和 网关IP,主要 负载均衡IP 或者 网关IP 能跟下面的具体集群成员之间相互通信
总结
TCP/IP 是一个可以解决复杂环境的 Hazelcast 集群成员发现方式,但是需要指定一个存活的成员地址。