最近部署了一个服务,使用docker部署(network:host模式),2个节点的服务自动注册xxl-job,但是测试环境没有问题,生产环境一直注册失败,虽然可以在项目配置中使用**"** 类似这样的配置**"**:job.executor.address=ip:port 将地址写死,但是目前不支持写多个地址,那么任务执行只有一个节点,有单点故障且效率不高问题。
问题排查:
生产环境自动注册时,注册上的地址是:172.10.x.x, 这是服务器网桥的网卡。当docker容器使用bridge模式时会使用容器的ip。于是查看生产服务器的网络模式如下:
docker network ls
发现目标服务默认使用的是网桥模式,查看当前容器的网桥模式进行确认:
docker inspect itda-business|grep host
发现目前使用的是主机模式, 于是重启docker服务:
service docker restart
但是结果自动注册的还是: 172.10.x.x,对比查看测试环境服务的网络模式:
docker network ls
虽然有几个无关的前端服务默认是网桥模式,但是网桥模式中并没有看到目标服务。不确定是什么原因导致生产服务器主机模式无法生效。思考目前的现状是:docker部署都是基于主机模式,于是将生产服务器的网桥进行删除,解决了该问题。删除网桥的脚本如下:
bash
#!/bin/bash
#本脚本删除的是br-开头的网桥
BRIDGE_LIST=$(sudo brctl show | cut -f 1 | grep br-)
echo "即将删除的网桥是:"$BRIDGE_LIST
for i in $BRIDGE_LIST
do
sudo ifconfig $i down
sudo brctl delbr $i
done
echo "删除之后用主机网桥状态如下:"
echo sudo brctl show
需要注意的是,如果有其他服务没有配置network,默认是网桥模式,还需要再重新生成docker, 否则网桥模式的服务不可用。即使服务器又配置了网桥,之前的目标服务仍然是主机模式哈。
docker stop xxx-business && docker rm xxx-business && docker-compose up -d
参考文章: