问题处理-k8s环境中,hadoop端口9000无法被访问

说明

因环境特殊,描述粗略,若有类似环境问题难以解决,可直接留言。或email联系zhuyifei.ruichuang@gmail.com

问题现象

hadoop的9000端口无法被访问

环境描述

k8s部署了hadoop测试环境。采用all in one pod的方式。给其他pod提供服务,需可在hadoop所在的namespace内外均可访问。

排查记录

查询pod

bash 复制代码
root@master:~# kubectl get pod -n hive
NAME                                  READY   STATUS    RESTARTS      AGE
hive-metastore-595d9d4b6b-vrhbh       1/1     Running   2 (83d ago)   83d
hive312-deployment-656c8d98f8-fv676   1/1     Running   0             7d2h
ubuntu-deployment-69845fb6d5-bl9sm    1/1     Running   0             8d

进入pod内的容器查询进程,此处确认了端口和进程都在

bash 复制代码
root@master:~# kubectl exec -it -n hive hive312-deployment-656c8d98f8-fv676 -- bash
root@hive312-deployment-656c8d98f8-fv676:/# lsof -i :9000
COMMAND  PID   USER   FD   TYPE     DEVICE SIZE/OFF NODE NAME
java    3396 hadoop  270u  IPv4 2124636242      0t0  TCP localhost:9000 (LISTEN)
...

问题出在localhost:9000,这里表示监听本地,不接受其他来源。导致跨pod访问被拒绝。 停掉hadoop。务必先关停,后改配置,否则会导致服务只能kill -9关停。

bash 复制代码
root@hive312-deployment-656c8d98f8-fv676:/opt/hadoop-3.1.1# su - hadoop
hadoop@hive312-deployment-656c8d98f8-fv676:~$ cd /opt/hadoop-3.1.1/sbin/
hadoop@hive312-deployment-656c8d98f8-fv676:/opt/hadoop-3.1.1/sbin$ ./stop-all.sh 

(关键)修改配置文件,此处只展示了关键配置,没这一段的就追加进去。这里表示监听所有的访问者。

bash 复制代码
root@hive312-deployment-656c8d98f8-fv676:/opt/hadoop-3.1.1/etc/hadoop# cat hdfs-site.xml 
<property>
  <name>dfs.namenode.rpc-address</name>
  <value>0.0.0.0:9000</value>
</property>

启动hadoop

bash 复制代码
root@hive312-deployment-656c8d98f8-fv676:/opt/hadoop-3.1.1/etc/hadoop# su - hadoop
hadoop@hive312-deployment-656c8d98f8-fv676:~$ cd /opt/hadoop-3.1.1/sbin/
hadoop@hive312-deployment-656c8d98f8-fv676:/opt/hadoop-3.1.1/sbin$ ./start-all.sh

查询进程,看到*:9000,此时允许所有访问者。

bash 复制代码
root@hive312-deployment-656c8d98f8-fv676:/opt/hadoop-3.1.1/etc/hadoop# lsof -i :9000
COMMAND  PID   USER   FD   TYPE     DEVICE SIZE/OFF NODE NAME
java    3396 hadoop  270u  IPv4 2124636242      0t0  TCP *:9000 (LISTEN)
java    3396 hadoop  280u  IPv4 2124655660      0t0  TCP hive312-deployment-656c8d98f8-fv676:9000->hive312-deployment-656c8d98f8-fv676:37284 (ESTABLISHED)
java    3491 hadoop  295u  IPv4 2124641848      0t0  TCP hive312-deployment-656c8d98f8-fv676:37284->hive312-deployment-656c8d98f8-fv676:9000 (ESTABLISHED)

访问测试 此时在其他的namespace的pod的容器内,向该容器的9000端口发起访问,测试成功。

相关推荐
java_cj4 天前
深入kube-apiserver认证机制:从Bearer Token到mTLS的完整认证链解析
linux·运维·服务器·云原生·容器·kubernetes
qq_452396234 天前
第十三篇:《K8s 安全基础:RBAC、ServiceAccount、Pod Security》
java·安全·kubernetes
睡不醒男孩0308235 天前
云原生运维实战:高并发架构下的云原生可观测性、韧性降级与自动化干预体系
数据库·kubernetes·高并发·prometheus·devops·sre·缓存调优
qq_452396235 天前
第十四篇:《K8s 网络模型与 CNI 插件(Calico、Flannel、Cilium)》
网络·kubernetes·php
Hadoop_Liang5 天前
Kubernetes 应用 HTTPS 安全访问配置实践
https·kubernetes
java_cj5 天前
从0到1启动kube-apiserver:深入源码解析API Server启动全流程
docker·容器·kubernetes
Hadoop_Liang5 天前
使用Kubernetes Gateway API实现域名访问应用
容器·kubernetes·gateway
java_cj5 天前
深入kubectl create源码:从YAML到Pod的完整链路拆解
运维·云原生·容器·kubernetes
万能的知了5 天前
K8s到底需不需要GPU节点?集群资源分配的底层逻辑
云原生·容器·kubernetes
卧室小白6 天前
K8S基础-控制器&deploy&pod回滚更新&service
docker·容器·kubernetes