Kubernetes StatefulSet 实战:从创建到运维的完整指南

Kubernetes StatefulSet 实战:从创建到运维的完整指南

一、前言:StatefulSet 实战核心目标

本文围绕 StatefulSet 的创建、验证、扩容缩容、更新、删除 五大核心操作,结合完整命令与输出示例,帮你掌握:

  • 如何快速搭建 StatefulSet + Headless Service 环境;

  • 验证 StatefulSet 的三大核心特性(稳定网络、持久存储、有序操作);

  • 生产环境常用运维操作(扩容、缩容、版本更新、删除);

  • 关键配置(更新策略、分区发布)的实操落地。

二、核心前提:StatefulSet 依赖组件

StatefulSet 运行必须满足两个核心依赖:

  1. Headless Service :提供稳定网络标识(DNS 解析),clusterIP: None

  2. PersistentVolume(PV) :通过 volumeClaimTemplates 自动创建,保障数据持久化。

三、实战步骤 1:创建 StatefulSet 与 Headless Service

3.1 配置文件(web.yaml)
复制代码
---

# Headless Service:提供稳定网络标识

apiVersion: v1

kind: Service

metadata:

 name: nginx

 labels:

   app: nginx

spec:

 ports:

 - port: 80

   name: web

 clusterIP: None  # 关键:无集群 IP,仅提供 DNS 解析

 selector:

   app: nginx

---

# StatefulSet 配置:2 个副本 + 1Gi 持久存储

apiVersion: apps/v1beta1

kind: StatefulSet

metadata:

 name: web

spec:

 serviceName: "nginx"  # 关联 Headless Service

 replicas: 2

 template:

   metadata:

     labels:

       app: nginx

   spec:

     containers:

     - name: nginx

       image: gcr.io/google_containers/nginx-slim:0.8

       ports:

       - containerPort: 80

         name: web

       volumeMounts:

       - name: www  # 与 volumeClaimTemplates 名称一致

         mountPath: /usr/share/nginx/html

 # 持久存储模板:自动为每个 Pod 创建 PVC

 volumeClaimTemplates:

 - metadata:

     name: www

   spec:

     accessModes: [ "ReadWriteOnce" ]  # 单节点读写

     resources:

       requests:

         storage: 1Gi
3.2 执行创建命令
  1. 打开两个终端窗口:
  • 终端 1(监控 Pod 状态):

    kubectl get pods -w -l app=nginx

  • 终端 2(执行创建操作):

    kubectl create -f web.yaml

    输出:

    service "nginx" created

    statefulset "web" created

  1. 验证创建结果:

    查看 Headless Service

    kubectl get service nginx

    输出:NAME CLUSTER-IP EXTERNAL-IP PORT(S) AGE

    nginx None > 80/TCP 12s

    查看 StatefulSet

    kubectl get statefulset web

    输出:NAME DESIRED CURRENT AGE

    web 2 2 30s

3.3 关键现象:有序创建 Pod

终端 1 监控到的 Pod 创建顺序:

复制代码
web-0     0/1       Pending   0          0s

web-0     1/1       Running   0         19s  # 先启动 web-0

web-1     0/1       Pending   0         0s

web-1     1/1       Running   0         18s  # web-0 就绪后启动 web-1

核心特性:StatefulSet 按

0→1→N-1

顺序创建 Pod,前一个就绪后才启动下一个。

四、实战步骤 2:验证 StatefulSet 核心特性

4.1 验证稳定网络标识

每个 Pod 拥有固定主机名和 DNS 地址:

复制代码
# 1. 查看 Pod 主机名(固定为 <statefulset 名称>-<序号>)

for i in 0 1; do kubectl exec web-$i -- sh -c 'hostname'; done

# 输出:

# web-0

# web-1

# 2. 验证集群内 DNS 解析(使用 dnsutils 容器)

kubectl run -i --tty --image busybox dns-test --restart=Never --rm /bin/sh

# 执行 nslookup:

nslookup web-0.nginx  # 输出:Address 1: 10.244.1.6 web-0.nginx.default.svc.cluster.local

nslookup web-1.nginx  # 输出:Address 1: 10.244.2.6 web-1.nginx.default.svc.cluster.local

关键结论:即使 Pod 重建,主机名和 DNS 地址不变,仅 IP 可能更新。

4.2 验证稳定持久存储

数据不随 Pod 重建丢失:

复制代码
# 1. 向每个 Pod 的存储写入主机名(模拟业务数据)

for i in 0 1; do kubectl exec web-$i -- sh -c 'echo $(hostname) > /usr/share/nginx/html/index.html'; done

# 2. 验证数据写入成功

for i in 0 1; do kubectl exec -it web-$i -- curl localhost; done

# 输出:

# web-0

# web-1

# 3. 删除所有 Pod,观察重建后数据是否保留

kubectl delete pod -l app=nginx

# 等待 Pod 重建完成后,再次验证:

for i in 0 1; do kubectl exec -it web-$i -- curl localhost; done

# 输出仍为 web-0、web-1,数据未丢失!

核心特性:每个 Pod 绑定独立 PV,删除 Pod 后 PV 不删除,重建后自动挂载。

五、实战步骤 3:常用运维操作(扩容 / 缩容 / 更新 / 删除)

5.1 扩容 StatefulSet(从 2 到 5 个副本)
复制代码
# 终端 1 监控 Pod 状态:kubectl get pods -w -l app=nginx

# 终端 2 执行扩容:

kubectl scale sts web --replicas=5

# 输出:statefulset "web" scaled

关键现象 :按 2→3→4 顺序创建 Pod,每个 Pod 就绪后才启动下一个。

5.2 缩容 StatefulSet(从 5 到 3 个副本)
复制代码
# 终端 1 监控 Pod 状态

# 终端 2 执行缩容:

kubectl patch sts web -p '{"spec":{"replicas":3}}'

# 输出:"web" patched

关键现象 :按 4→3 反向顺序删除 Pod,前一个 Pod 完全终止后才删除下一个。

5.3 更新 StatefulSet(镜像版本升级)

StatefulSet 支持两种更新策略,实操如下:

策略 1:OnDelete(默认,手动触发更新)
复制代码
# 1. 修改镜像版本(从 0.8 到 0.7)

kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.7"}]'

# 2. 手动删除 Pod,触发更新(仅删除的 Pod 会更新)

kubectl delete pod web-0 web-1 web-2

# 3. 验证更新结果

kubectl get pod -l app=nginx -o jsonpath='{range .items[*]}{.metadata.name}{"t"}{.spec.containers[0].image}{"n"}{end}'

# 输出:所有 Pod 镜像已更新为 0.7
策略 2:RollingUpdate(自动滚动更新)
复制代码
# 1. 配置滚动更新策略

kubectl patch statefulset web -p '{"spec":{"updateStrategy":{"type":"RollingUpdate"}}}'

# 2. 修改镜像版本(从 0.7 回滚到 0.8)

kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.8"}]'

# 3. 监控更新过程(反向顺序:web-2→web-1→web-0)

kubectl get po -l app=nginx -w
高级操作:分区更新(金丝雀发布)

仅更新序号 ≥ partition 的 Pod:

复制代码
# 1. 配置分区(仅更新序号 ≥2 的 Pod,即 web-2)

kubectl patch statefulset web -p '{"spec":{"updateStrategy":{"type":"RollingUpdate","rollingUpdate":{"partition":2}}}}'

# 2. 修改镜像版本,仅 web-2 会更新

kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.7"}]'

# 3. 验证结果(仅 web-2 为 0.7,其余为 0.8)

kubectl get pod -l app=nginx -o jsonpath='{range .items[*]}{.metadata.name}{"t"}{.spec.containers[0].image}{"n"}{end}'
5.4 删除 StatefulSet
方式 1:非级联删除(仅删 StatefulSet,保留 Pod 和 PV)
复制代码
kubectl delete statefulset web --cascade=false

# 验证:Pod 仍运行,PV 保留

kubectl get pods -l app=nginx

kubectl get pvc -l app=nginx
方式 2:级联删除(删 StatefulSet + Pod,保留 PV)
复制代码
kubectl delete statefulset web

# 验证:Pod 按反向顺序删除,PV 仍存在

kubectl get pods -l app=nginx  # 无输出

kubectl get pvc -l app=nginx  # 仍显示绑定状态

# 手动删除 Headless Service(级联删除不会删 Service)

kubectl delete service nginx

六、关键配置与生产实践总结

操作类型 核心命令 / 配置 关键注意事项
创建 kubectl create -f web.yaml 必须先创建 Headless Service
扩容 / 缩容 kubectl scale sts plicas=N 有序扩容、反向缩容,依赖前驱 Pod 就绪
版本更新 RollingUpdate/OnDelete 生产环境优先用 RollingUpdate,支持回滚
金丝雀发布 partition: N 仅更新序号 ≥N 的 Pod,适合灰度验证
删除 --cascade=false/ 默认 PV 永远不会自动删除,需手动清理无用 PV
数据持久化 volumeClaimTemplates 确保 StorageClass 已配置,避免 PVC Pending

七、核心结论

  1. StatefulSet 的核心价值是 稳定标识 + 持久存储 + 有序操作,专为数据库、缓存等有状态服务设计;

  2. 运维关键:牢记「有序创建 / 缩容 / 更新」特性,避免强制终止 Pod 导致数据不一致;

  3. 存储管理:删除 StatefulSet 后,需手动清理无用 PV,避免存储资源浪费;

  4. 更新策略:生产环境优先使用 RollingUpdate + partition,实现安全的灰度发布和版本回滚。

通过本文实操,可快速掌握 StatefulSet 从部署到运维的全流程,直接复用命令和配置到生产环境。

相关推荐
AI生产力指南2 小时前
泛微·易秒办集成OpenClaw机器人:打造“能说会做”的智能助手
运维·网络·人工智能
小兔薯了2 小时前
docker
运维·docker·容器
相思难忘成疾2 小时前
Linux SSH免密登录实验:基于Xshell的公钥认证机制
linux·运维·ssh·rhce
gushinghsjj2 小时前
主数据管理平台如何落地?怎么部署主数据管理平台?
大数据·运维·人工智能
梦想的旅途22 小时前
企微自动化办公:实现外部群聊的高级交互逻辑
运维·数据库·自动化·企业微信·rpa
其实防守也摸鱼5 小时前
GDB安装与配置(保姆级教程)【Linux、Windows系统】
linux·运维·windows·命令模式·工具·虚拟机·调试
Elastic 中国社区官方博客11 小时前
为 Elastic Cloud Serverless 和 Elasticsearch 引入统一的 API 密钥
大数据·运维·elasticsearch·搜索引擎·云原生·serverless
空中海11 小时前
Kubernetes 生产实践、可观测性与扩展入门
java·贪心算法·kubernetes
Agent手记11 小时前
制造业数字化升级:生产全流程企业级智能体落地解决方案 —— 基于LLM+超自动化全栈架构的智改数转深度实战
运维·ai·架构·自动化