k8s中基于alpine的pod无法解析域名问题

现象

在pod内无法解析指定域名

shell 复制代码
# 执行ping
bash-4.4# ping xx-xx-svc-0.xxx-fcp.svc.cluster.local
ping: bad address 'xx-xx-svc-0.xxx-fcp.svc.cluster.local'

排查经过

bash 复制代码
# 执行nslookup
bash-4.4# nslookup xx-xx-svc-0.xxx-fcp.svc.cluster.local
Server:         172.43.0.10
Address:        172.43.0.10#53

** server can't find xx-xx-svc-0.xxx-fcp.svc.cluster.local.localdomain: SERVFAIL

通过nslookup的输出结果可知,无法解析该域名的原因是系统默认将域名补全为.localdomain结尾,导致域名无法解析

bash 复制代码
# 查看pod内的/etc/resolv.conf
bash-4.4# cat /etc/resolv.conf 
nameserver 172.43.0.10
search xxx-fcp.svc.cluster.local svc.cluster.local cluster.local localdomain
options ndots:5

在/etc/resolv.conf中,option ndots:5表示设置了DNS解析器的ndots参数为5。这意味着当解析器尝试解析一个域名时,只有在该域名中至少包含5个点(".")时,才会将其视为绝对域名进行解析。否则被视为不完整域名,会按照search的配置顺序,从左到有一次补全并解析

bash 复制代码
# 通过host命令可以查看域名补全解析过程
bash-4.4# host -v  xx-xx-svc-0.xxx-fcp.svc.cluster.local
Trying "xx-xx-svc-0.xxx-fcp.svc.cluster.local.treasurer-fcp.svc.cluster.local"
Trying "xx-xx-svc-0.xxx-fcp.svc.cluster.local.svc.cluster.local"
Trying "xx-xx-svc-0.xxx-fcp.svc.cluster.local.cluster.local"
Trying "xx-xx-svc-0.xxx-fcp.svc.cluster.local.localdomain"  # 该条已经满足5个点,不会再解析xx-xx-svc-0.xxx-fcp.svc.cluster.local. 但是pod中相同的/etc/resolv.conf配置,在centos7基础镜像中又好像能解析,待验证
Host xquant-xir-svc-0.xquantns-fcp.svc.cluster.local.localdomain not found: 2(SERVFAIL)
bash 复制代码
# 查看pod所在服务器的/etc/resolv.conf
bash-4.4# cat /etc/resolv.conf 
search localdomain

pod解析正常的服务器节点上,该文件内容为空。可见主机上的search localdomain会被加载到pod内,对域名解析产生干扰

解决办法

bash 复制代码
1. 清理主机上的/etc/resolv.conf
# > /etc/resolv.conf
2. pod内修改/etc/resolv.conf配置文件,移除search的localdomain
3. /etc/resolv.conf修改ndots为4

冷知识

在 DNS 中,末尾加上句点(.)通常表示绝对域名(Fully Qualified Domain Name,FQDN)。当域名以句点结尾时,表示该域名是一个绝对完整的域名,不会再添加本地搜索域或其他默认域名后缀。

相关推荐
魏 无羡2 小时前
linux CentOS系统上卸载docker
linux·kubernetes·centos
Karoku0662 小时前
【k8s集群应用】kubeadm1.20高可用部署(3master)
运维·docker·云原生·容器·kubernetes
凌虚4 小时前
Kubernetes APF(API 优先级和公平调度)简介
后端·程序员·kubernetes
探索云原生7 小时前
在 K8S 中创建 Pod 是如何使用到 GPU 的: nvidia device plugin 源码分析
ai·云原生·kubernetes·go·gpu
启明真纳7 小时前
elasticache备份
运维·elasticsearch·云原生·kubernetes
jwolf29 小时前
基于K8S的微服务:一、服务发现,负载均衡测试(附calico网络问题解决)
微服务·kubernetes·服务发现
nangonghen9 小时前
在华为云通过operator部署Doris v2.1集群
kubernetes·华为云·doris·operator
会飞的土拨鼠呀11 小时前
chart文件结构
运维·云原生·kubernetes
自在的LEE14 小时前
当 Go 遇上 Windows:15.625ms 的时间更新困局
后端·kubernetes·go
云川之下17 小时前
【k8s】访问etcd
kubernetes·etcd