现象
在pod内无法解析指定域名
shell
# 执行ping
bash-4.4# ping xx-xx-svc-0.xxx-fcp.svc.cluster.local
ping: bad address 'xx-xx-svc-0.xxx-fcp.svc.cluster.local'
排查经过
bash
# 执行nslookup
bash-4.4# nslookup xx-xx-svc-0.xxx-fcp.svc.cluster.local
Server: 172.43.0.10
Address: 172.43.0.10#53
** server can't find xx-xx-svc-0.xxx-fcp.svc.cluster.local.localdomain: SERVFAIL
通过nslookup的输出结果可知,无法解析该域名的原因是系统默认将域名补全为.localdomain结尾,导致域名无法解析
bash
# 查看pod内的/etc/resolv.conf
bash-4.4# cat /etc/resolv.conf
nameserver 172.43.0.10
search xxx-fcp.svc.cluster.local svc.cluster.local cluster.local localdomain
options ndots:5
在/etc/resolv.conf中,option ndots:5表示设置了DNS解析器的ndots参数为5。这意味着当解析器尝试解析一个域名时,只有在该域名中至少包含5个点(".")时,才会将其视为绝对域名进行解析。否则被视为不完整域名,会按照search的配置顺序,从左到有一次补全并解析
bash
# 通过host命令可以查看域名补全解析过程
bash-4.4# host -v xx-xx-svc-0.xxx-fcp.svc.cluster.local
Trying "xx-xx-svc-0.xxx-fcp.svc.cluster.local.treasurer-fcp.svc.cluster.local"
Trying "xx-xx-svc-0.xxx-fcp.svc.cluster.local.svc.cluster.local"
Trying "xx-xx-svc-0.xxx-fcp.svc.cluster.local.cluster.local"
Trying "xx-xx-svc-0.xxx-fcp.svc.cluster.local.localdomain" # 该条已经满足5个点,不会再解析xx-xx-svc-0.xxx-fcp.svc.cluster.local. 但是pod中相同的/etc/resolv.conf配置,在centos7基础镜像中又好像能解析,待验证
Host xquant-xir-svc-0.xquantns-fcp.svc.cluster.local.localdomain not found: 2(SERVFAIL)
bash
# 查看pod所在服务器的/etc/resolv.conf
bash-4.4# cat /etc/resolv.conf
search localdomain
pod解析正常的服务器节点上,该文件内容为空。可见主机上的search localdomain会被加载到pod内,对域名解析产生干扰
解决办法
bash
1. 清理主机上的/etc/resolv.conf
# > /etc/resolv.conf
2. pod内修改/etc/resolv.conf配置文件,移除search的localdomain
3. /etc/resolv.conf修改ndots为4
冷知识
在 DNS 中,末尾加上句点(.)通常表示绝对域名(Fully Qualified Domain Name,FQDN)。当域名以句点结尾时,表示该域名是一个绝对完整的域名,不会再添加本地搜索域或其他默认域名后缀。