docker swarm多主机之间的端口无法访问,但能ping通 问题排查及解决

已排查:1.ufw status 防火墙已关闭 2.selinux已关闭 3.netstat -ntpl :::8088 未限制ip

问题:docker swarm多主机之间的端口无法访问,但能ping通,同一主机下的端口也可以访问。

原因:docker overlay网络内部使用vxlan技术实现网络内部互通,通过 udp 4789 端口进行流量转发,此端口可以在swarm初始化时修改。

解决:tcpdump每台机器物理网卡的4789端口的流量:tcpdump -i ens160 udp port 4789 -vv -X;

在worker节点上访问manager节点的tcp 9999服务,可以看到如下报文:

tcpdump: listening on ens160, link-type EN10MB (Ethernet), capture size 262144 bytes

13:40:49.011232 IP (tos 0x0, ttl 64, id 25866, offset 0, flags [none], proto UDP (17), length 110)

master-01.41787 > 10.168.1.181.4789: [bad udp cksum 0x174d -> 0x4773!] UDP, length 82

0x0000: 4500 006e 650a 0000 4011 fcc6 0aa8 01aa E..ne...@.......

显示udp报文异常:bad udp cksum 0x174d -> 0x4773,原因是linux默认开启了内核计算cksum和网卡计算cksum,此处一般为网卡计算cksum错误,需要关闭网卡计算的功能;

命令 ethtool -k ens160 查看开启的情况。

其中tx-checksumming为网卡计算cksum的配置项,需要将其关闭:

ethtool --offload ens160 tx off

同时需要将manager节点的此配置也关闭,步骤同上;

最后检查是否可以连通即可

开机自动关闭:修改 /root/.bashrc 文件,添加如下行:

disable ts-checksumming on boot

/sbin/ethtool --offload ens160 tx off

注意:修改/root/.bashrc 文件只会在以 root 用户身份登录时生效。对所有用户生效可以修改/etc/bashrc

相关推荐
Elastic 中国社区官方博客17 分钟前
使用 ES|QL 变量控件将仪表板转变为调查工具
大数据·运维·服务器·数据库·elasticsearch·搜索引擎·全文检索
feng68_20 分钟前
Ansible还原数据库节点
linux·运维·数据库·ansible
司南-704932 分钟前
claude初探- 国内镜像安装linux版claude
linux·运维·服务器·人工智能·后端
为美好的生活献上中指35 分钟前
*Java 沉淀重走长征路*之——《Linux 从入门到企业实战:一套六步法,带你打通运维与开发的任督二脉》
java·linux·运维·开发语言·阿里云·华为云·linux命令
何妨呀~37 分钟前
Docker部署与配置全攻略
运维·docker·容器
janthinasnail40 分钟前
使用Docker安装code-server(VS Code in the browser)
docker·code-server
路由侠内网穿透1 小时前
本地部署开源 LLM 应用观测与调试平台 Langfuse 并实现外部访问
运维·服务器·数据库·物联网·开源
m0_612591971 小时前
尚航科技 IDC vs 其他服务商:企业服务器托管选择对比
运维·服务器·idc
Magic--1 小时前
Linux静态库与共享库(动态库)详解
linux·运维·服务器
河码匠1 小时前
Kubernetes YAML 详解之网络服务二( Ingress、IngressClasses)
云原生·容器·kubernetes