Kubernetes 架构

一、Kubernetes 架构分层解析

整个架构可以分为三层:

1️⃣ 控制平面(Control Plane)

包括以下关键组件:

组件 作用
API Server 所有组件交互的统一入口,负责接收来自 kubectlweb UI 或其他组件的请求。它是整个集群的"前门"。
etcd 分布式键值存储,用来保存所有集群状态数据(包括节点信息、Pod 定义、副本数、配置等)。API Server 会将集群的状态写入或读取 etcd。
Scheduler 负责调度 Pod ------ 即决定"哪个 Pod 运行在哪个 Node 上"。调度依据包括资源、亲和性、污点/容忍等策略。
Controller Manager(或 replication controller) 负责集群状态的"自愈"与"期望状态保持"。当实际状态与期望状态不符时,会创建或删除 Pod、Service 等资源以达到目标。

2️⃣ 节点层(Node Layer)

每个 Node(工作节点)都运行以下关键组件:

组件 作用
kubelet 负责与 API Server 通信,根据指令创建或销毁 Pod,监控容器状态,并上报节点资源使用情况。
kube-proxy 管理节点上的网络规则,确保服务间的负载均衡和网络访问。
Pod(容器组) 最小的调度单元,一个 Pod 内可包含一个或多个容器。

3️⃣ 用户访问层

组件 说明
kubectl 命令行工具,用于与 API Server 通信,提交配置、查看状态。
Web UI (Dashboard) 图形化管理界面。
Internet / Firewall 指外部访问流量或安全层。

✅ 二、Kubernetes 的工作流程(按图中箭头顺序)

1️⃣ 用户发出请求

用户通过 kubectl 或 Web UI 提交一个 YAML 清单(例如定义了一个 Deployment,指定需要运行 3 个副本的 Nginx Pod)。

2️⃣ API Server 接收请求

API Server 作为入口,验证请求合法性并将资源信息写入 etcd

3️⃣ Controller Manager 监控状态

Controller Manager 监控 etcd 中的数据,发现"期望副本数为3,但实际为0",于是会创建 3 个新的 Pod 对象。

4️⃣ Scheduler 负责调度

Scheduler 负责为这些待创建的 Pod 选择合适的 Node(根据资源负载、亲和性、污点等规则)。

5️⃣ Node 执行任务

每个 Node 上的 kubelet 接收到调度结果后,通过容器运行时(如 containerd、Docker)真正创建出容器。

6️⃣ kube-proxy 处理网络

kube-proxy 更新 iptables/ipvs 规则,实现 Pod 与 Service 之间的通信和负载均衡。

7️⃣ 状态反馈

各 Node 将 Pod 运行状态上报给 API Server,Controller Manager 持续监控并维持系统的期望状态。


⚠️ 三、你原理解中的小问题与补充建议

问题 / 不足 修正 / 补充说明
你提到 "scheduler 进行任务调用,将任务分给不同 node" ✅ 基本正确,但 scheduler 并不直接"执行任务",它只做"调度决策",告诉 kubelet 哪个 Pod 该在哪个节点运行。实际创建容器的动作由 kubelet 执行。
"api server 将请求写入 etcd" ✅ 正确。需要补充:API Server 同时也负责认证、授权、数据校验和变更通知(watch机制)。
"replication controller 用于维护副本数" ✅ 对的,但更准确地说,现在推荐使用 ReplicaSet / Deployment 来管理副本。ReplicationController 已逐渐被替代。
"scheduler、controller 等组件都在一个 node 中" ❌ 不完全准确。控制平面(包含 scheduler/controller/api-server/etcd)通常运行在 Master 节点(现在称为 Control Plane Node),而不是普通 node 上。
"改写 Pod 的数量" ✅ 思路对,但 RC/ReplicaSet 实际上是通过修改 YAML 定义中的 replicas 字段,从而触发控制器调整 Pod 数量。

✅ 四、总结一句话流程

用户通过 kubectl → API Server 接收请求并写入 etcd → Controller 发现期望状态与实际状态不符 → Scheduler 选择节点 → kubelet 在节点上启动 Pod → kube-proxy 管理通信 → 系统持续自愈与同步状态。

相关推荐
一叶飘零_sweeeet20 小时前
MySQL高可用生产落地全解:主从同步、MGR集群、读写分离从原理到实战
数据库·mysql·架构·mysql高可用
知识分享小能手20 小时前
Redis入门学习教程,从入门到精通,Redis集群架构:语法知识点、使用方法与综合案例(6)
redis·学习·架构
tianyuanwo20 小时前
Koji 分布式编译调度机制深度解析:多架构异构节点的资源优化方案
分布式·架构
vpk11221 小时前
Docker 安装与常用命令
运维·docker·容器
vpk11221 小时前
Docker Compose 安装 MySQL 8
mysql·容器
源远流长jerry1 天前
RDMA 技术深度解析:从原理到实践
linux·网络·tcp/ip·架构·ip
FJW0208141 天前
cephadm部署ceph集群以及k8s对接
ceph·容器·kubernetes
Are_You_Okkk_1 天前
开源知识库的核心技术赋能与企业级落地路径
人工智能·架构·开源
源远流长jerry1 天前
RDMA 基本元素详解:从 WQE 到 QP 再到 CQ
linux·开发语言·网络·tcp/ip·架构·ip
小江的记录本1 天前
【VO、DTO、Entity】VO、DTO、Entity三大核心数据对象全解析(附核心对比表 + 代码示例)
java·数据库·spring boot·spring·架构·mybatis·数据库架构