记一次服务间调用失败的bug

1. 服务环境描述

1.所有服务都注册到Consul上,服务间调用采用的是服务名;

2.所有服务用docker容器化部署,用docker swarm管理服务集群;

3.docker compose编排文件里的所有服务的端口均未映射出来,即没有加 ports: -8080:8080 这样的配置项;

2. 增加A服务的端口映射

由于需求需要,我让工程把服务器上的 A 服务的端口映射出来,

于是工程在docker-compose.yml 中A服务处新增了 ports: -8099:8099 这样的配置项。

3. 问题出现

B服务的日志内报无法调通 A 服务的异常

4. 排查

于是我进入B服务的容器内,用curl命令发请求,发现确实请求不通A服务,但是把A服务的serviceName1 改成 serviceName2:8099 可以请求通;

【注:serviceName1 是A服务在consul中的服务名,serviceName2:8099 是A服务在docker-compose编排里的服务名】

5. 猜测

由于第二步修改A服务的端口映射,到问题出现,中间隔了好几天,所以一开始并没想到是由于A服务的端口映射导致的这个问题,后来才想到可能跟这个有关系;

于是把docker-compose.yml 中A服务的 ports: -8099:8099 配置项注释了,重启服务,发现B服务就能正常通过serviceName1 调用A服务了。

6. 原因分析&解决

主机有多个网络(可通过docker network ls 查看),注册到consul时错误的网络会导致服务间无法调用,因此需要指定一下优先使用哪个网络。

需要在A服务的bootstrap.yml的配置文件中新增如下配置项:

(因为docker编排中设置的网络名称就是XXX_NET)

|-----------|--------------------------------------------------------------------------------|
| 1 2 3 4 5 | spring: ``cloud: ``inetutils: ``preferred-networks: ``- $XXX_NET |

参考:https://www.cnblogs.com/noidler/p/15019986.html

相关推荐
努力买辣条1 小时前
基于Docker的高可用WordPress集群部署:Nginx负载均衡+Mysql主从复制+ProxySQL读写分离
nginx·docker·负载均衡
记忆不曾留7 小时前
unbuntu 20.04 docker 部署wordpress
运维·docker·容器·wordpress·独立站建站
NPE~11 小时前
[docker/大数据]Spark快速入门
大数据·分布式·docker·spark·教程
TDengine (老段)12 小时前
TDengine IDMP 运维指南(4. 使用 Docker 部署)
运维·数据库·物联网·docker·时序数据库·tdengine·涛思数据
m0_5157904118 小时前
【深度学习实战(55)】记录一次在新服务器上使用docker的流程
docker
草明19 小时前
docker stats 增加一列容器名称的显示
java·开发语言·docker
楚禾Noah21 小时前
【通用常识】YAML 中的高阶语法
运维·docker·容器
东心十1 天前
Win11安装WSL、Docker Desktop
运维·docker·容器
预判你的代码1 天前
Docker 快速下载Neo4j 方法记录
docker·容器·neo4j
计算机小手1 天前
基于 Flask 与 Milvus 构建高效图片搜索引擎,可通过API接入,支持Docker一键部署
经验分享·docker·flask·开源软件·milvus