kubernetes中数据存储etcd

etcd 在 Kubernetes 中的角色

  • 核心定位 :Kubernetes 的 唯一持久化数据存储(一致性数据库)。

  • 职责

    • 保存整个集群的期望状态(desired state),包括节点信息、Pod 清单、Service 定义、ConfigMap、Secrets 等所有 API 对象。
    • 提供**强一致性(CP)**保障,保证即使多个 API Server 同时读写,也不会出现状态冲突。
    • 支持 Watch 机制:当 etcd 中数据变更时,API Server 能实时推送事件给控制器和客户端。
  • 关键关系

    • API Server 是所有组件的 "中枢",所有读写状态都通过它。
    • Controller Manager / Scheduler 都是 被动 响应 API Server 推送的事件(watch)。
    • kubelet 负责 Pod 在 Node 上的实际运行,向 API Server 上报状态。
    • CNI/CSI 插件由 kubelet 调用,实现网络和存储的实际配置。

数据存储结构

etcd 是一个 分布式键值数据库 ,内部使用 BoltDB(B+Tree 存储) 作为底层存储引擎。

  • Key 结构(逻辑路径)

    • Kubernetes 在 etcd 中为每种资源维护一个命名空间式路径,例如:

      复制代码
      /registry/pods/default/nginx-pod
      /registry/deployments/default/web-deploy
      /registry/configmaps/kube-system/coredns
    • /registry 是 Kubernetes 存放 API 对象的根前缀。

    • 路径的最后一段是对象的名字(可能还带命名空间)。

  • Value 结构

    • 实际是序列化后的 Protocol Buffers(Protobuf) 或 JSON。
    • 内含对象的 metadataspecstatus 等字段。
    • 同时存储 ResourceVersion(单调递增)用于一致性和 Watch。
  • 版本控制

    • etcd 每个 key 有 修改版本(mod_revision) ,整个数据库有全局递增 revision
    • Kubernetes API Server 用 resourceVersion 与 etcd revision 对应,保证读取的一致性快照。

数据写入流程

kubectl apply -f pod.yaml 为例:

  1. 客户端提交
    kubectl 把 YAML 转成 Kubernetes API 对象,通过 REST 调用 API Server。

  2. API Server 流程

    • 认证/鉴权:验证请求是否合法。
    • 准入控制:MutatingAdmissionWebhook 可能修改对象(加默认值),ValidatingAdmissionWebhook 校验对象合法性。
    • 序列化:将对象编码为 Protobuf。
    • 存储层调用 :通过 Kubernetes 的 storage.Interface 调用 etcd v3 gRPC API。
  3. etcd 写入

    • etcd leader 接收 Put 请求。
    • Leader 将写请求通过 Raft 共识协议 复制到多数派 Follower 节点。
    • 多数节点写入成功(持久化到本地 BoltDB WAL + B+Tree)后,Leader 提交事务并返回成功。
    • 此时 mod_revision 增加,触发 Watch 事件。
  4. 事件分发

    • API Server Watch 机制检测到新 revision,通知各 Controller、Scheduler、kubelet 等。
    • 各组件据此执行调度、创建容器等后续动作。

总结

维度 说明
角色 k8s 的唯一持久化存储,保存集群所有 API 对象状态
存储结构 Key-Value,Key 为 /registry/... 逻辑路径,Value 为 Protobuf 序列化对象
一致性保障 Raft 共识,强一致性,顺序提交
写入流程关键点 API Server → 序列化 → etcd Leader → Raft 复制 → 多数派确认 → 更新 revision → 触发 Watch

附件

etcd数据交互

K8s 核心组件调用关系 + etcd 交互点 + Endpoints 数据流

  • etcd 只与 API Server 通信
  • API Server 如何向 Controller、Scheduler、kubelet、Endpoints Controller 分发事件
  • Endpoints / EndpointSlice Controller 如何生成数据并被 kube-proxy/CoreDNS 使用
  • Node 上 kubelet 如何调用 CRI、CNI、CSI 执行实际操作
相关推荐
武子康1 小时前
调查研究-183 Apple container:Mac 上用轻量 VM 跑 Linux 容器,Swift 会改写本地容器体验吗?
docker·容器·apple
2601_961875243 天前
决战申论100题2026|最新|范文
linux·容器·centos·debian·ssh·fabric·vagrant
java_cj3 天前
深入kube-apiserver认证机制:从Bearer Token到mTLS的完整认证链解析
linux·运维·服务器·云原生·容器·kubernetes
程序员老赵3 天前
服务器没有桌面?Docker 跑个 Chrome,浏览器就能远程用
docker·容器·devops
正经教主3 天前
【docker基础】 第八周:容器监控与应用更新策略
运维·docker·容器
kiros_wang3 天前
Docker 使用完整指南
运维·docker·容器
正经教主3 天前
【docker基础】第九周:Docker安全与镜像优化
运维·docker·容器
qq_452396233 天前
第十三篇:《K8s 安全基础:RBAC、ServiceAccount、Pod Security》
java·安全·kubernetes
睡不醒男孩0308233 天前
云原生运维实战:高并发架构下的云原生可观测性、韧性降级与自动化干预体系
数据库·kubernetes·高并发·prometheus·devops·sre·缓存调优
qq_452396233 天前
第十四篇:《K8s 网络模型与 CNI 插件(Calico、Flannel、Cilium)》
网络·kubernetes·php