Kubernetes StatefulSet 实战:从创建到运维的完整指南
一、前言:StatefulSet 实战核心目标
本文围绕 StatefulSet 的创建、验证、扩容缩容、更新、删除 五大核心操作,结合完整命令与输出示例,帮你掌握:
-
如何快速搭建 StatefulSet + Headless Service 环境;
-
验证 StatefulSet 的三大核心特性(稳定网络、持久存储、有序操作);
-
生产环境常用运维操作(扩容、缩容、版本更新、删除);
-
关键配置(更新策略、分区发布)的实操落地。
二、核心前提:StatefulSet 依赖组件
StatefulSet 运行必须满足两个核心依赖:
-
Headless Service :提供稳定网络标识(DNS 解析),
clusterIP: None; -
PersistentVolume(PV) :通过
volumeClaimTemplates自动创建,保障数据持久化。
三、实战步骤 1:创建 StatefulSet 与 Headless Service
3.1 配置文件(web.yaml)
---
# Headless Service:提供稳定网络标识
apiVersion: v1
kind: Service
metadata:
name: nginx
labels:
app: nginx
spec:
ports:
- port: 80
name: web
clusterIP: None # 关键:无集群 IP,仅提供 DNS 解析
selector:
app: nginx
---
# StatefulSet 配置:2 个副本 + 1Gi 持久存储
apiVersion: apps/v1beta1
kind: StatefulSet
metadata:
name: web
spec:
serviceName: "nginx" # 关联 Headless Service
replicas: 2
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx
image: gcr.io/google_containers/nginx-slim:0.8
ports:
- containerPort: 80
name: web
volumeMounts:
- name: www # 与 volumeClaimTemplates 名称一致
mountPath: /usr/share/nginx/html
# 持久存储模板:自动为每个 Pod 创建 PVC
volumeClaimTemplates:
- metadata:
name: www
spec:
accessModes: [ "ReadWriteOnce" ] # 单节点读写
resources:
requests:
storage: 1Gi
3.2 执行创建命令
- 打开两个终端窗口:
-
终端 1(监控 Pod 状态):
kubectl get pods -w -l app=nginx
-
终端 2(执行创建操作):
kubectl create -f web.yaml
输出:
service "nginx" created
statefulset "web" created
-
验证创建结果:
查看 Headless Service
kubectl get service nginx
输出:NAME CLUSTER-IP EXTERNAL-IP PORT(S) AGE
nginx None > 80/TCP 12s
查看 StatefulSet
kubectl get statefulset web
输出:NAME DESIRED CURRENT AGE
web 2 2 30s
3.3 关键现象:有序创建 Pod
终端 1 监控到的 Pod 创建顺序:
web-0 0/1 Pending 0 0s
web-0 1/1 Running 0 19s # 先启动 web-0
web-1 0/1 Pending 0 0s
web-1 1/1 Running 0 18s # web-0 就绪后启动 web-1
核心特性:StatefulSet 按
0→1→N-1顺序创建 Pod,前一个就绪后才启动下一个。
四、实战步骤 2:验证 StatefulSet 核心特性
4.1 验证稳定网络标识
每个 Pod 拥有固定主机名和 DNS 地址:
# 1. 查看 Pod 主机名(固定为 <statefulset 名称>-<序号>)
for i in 0 1; do kubectl exec web-$i -- sh -c 'hostname'; done
# 输出:
# web-0
# web-1
# 2. 验证集群内 DNS 解析(使用 dnsutils 容器)
kubectl run -i --tty --image busybox dns-test --restart=Never --rm /bin/sh
# 执行 nslookup:
nslookup web-0.nginx # 输出:Address 1: 10.244.1.6 web-0.nginx.default.svc.cluster.local
nslookup web-1.nginx # 输出:Address 1: 10.244.2.6 web-1.nginx.default.svc.cluster.local
关键结论:即使 Pod 重建,主机名和 DNS 地址不变,仅 IP 可能更新。
4.2 验证稳定持久存储
数据不随 Pod 重建丢失:
# 1. 向每个 Pod 的存储写入主机名(模拟业务数据)
for i in 0 1; do kubectl exec web-$i -- sh -c 'echo $(hostname) > /usr/share/nginx/html/index.html'; done
# 2. 验证数据写入成功
for i in 0 1; do kubectl exec -it web-$i -- curl localhost; done
# 输出:
# web-0
# web-1
# 3. 删除所有 Pod,观察重建后数据是否保留
kubectl delete pod -l app=nginx
# 等待 Pod 重建完成后,再次验证:
for i in 0 1; do kubectl exec -it web-$i -- curl localhost; done
# 输出仍为 web-0、web-1,数据未丢失!
核心特性:每个 Pod 绑定独立 PV,删除 Pod 后 PV 不删除,重建后自动挂载。
五、实战步骤 3:常用运维操作(扩容 / 缩容 / 更新 / 删除)
5.1 扩容 StatefulSet(从 2 到 5 个副本)
# 终端 1 监控 Pod 状态:kubectl get pods -w -l app=nginx
# 终端 2 执行扩容:
kubectl scale sts web --replicas=5
# 输出:statefulset "web" scaled
关键现象 :按 2→3→4 顺序创建 Pod,每个 Pod 就绪后才启动下一个。
5.2 缩容 StatefulSet(从 5 到 3 个副本)
# 终端 1 监控 Pod 状态
# 终端 2 执行缩容:
kubectl patch sts web -p '{"spec":{"replicas":3}}'
# 输出:"web" patched
关键现象 :按 4→3 反向顺序删除 Pod,前一个 Pod 完全终止后才删除下一个。
5.3 更新 StatefulSet(镜像版本升级)
StatefulSet 支持两种更新策略,实操如下:
策略 1:OnDelete(默认,手动触发更新)
# 1. 修改镜像版本(从 0.8 到 0.7)
kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.7"}]'
# 2. 手动删除 Pod,触发更新(仅删除的 Pod 会更新)
kubectl delete pod web-0 web-1 web-2
# 3. 验证更新结果
kubectl get pod -l app=nginx -o jsonpath='{range .items[*]}{.metadata.name}{"t"}{.spec.containers[0].image}{"n"}{end}'
# 输出:所有 Pod 镜像已更新为 0.7
策略 2:RollingUpdate(自动滚动更新)
# 1. 配置滚动更新策略
kubectl patch statefulset web -p '{"spec":{"updateStrategy":{"type":"RollingUpdate"}}}'
# 2. 修改镜像版本(从 0.7 回滚到 0.8)
kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.8"}]'
# 3. 监控更新过程(反向顺序:web-2→web-1→web-0)
kubectl get po -l app=nginx -w
高级操作:分区更新(金丝雀发布)
仅更新序号 ≥ partition 的 Pod:
# 1. 配置分区(仅更新序号 ≥2 的 Pod,即 web-2)
kubectl patch statefulset web -p '{"spec":{"updateStrategy":{"type":"RollingUpdate","rollingUpdate":{"partition":2}}}}'
# 2. 修改镜像版本,仅 web-2 会更新
kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.7"}]'
# 3. 验证结果(仅 web-2 为 0.7,其余为 0.8)
kubectl get pod -l app=nginx -o jsonpath='{range .items[*]}{.metadata.name}{"t"}{.spec.containers[0].image}{"n"}{end}'
5.4 删除 StatefulSet
方式 1:非级联删除(仅删 StatefulSet,保留 Pod 和 PV)
kubectl delete statefulset web --cascade=false
# 验证:Pod 仍运行,PV 保留
kubectl get pods -l app=nginx
kubectl get pvc -l app=nginx
方式 2:级联删除(删 StatefulSet + Pod,保留 PV)
kubectl delete statefulset web
# 验证:Pod 按反向顺序删除,PV 仍存在
kubectl get pods -l app=nginx # 无输出
kubectl get pvc -l app=nginx # 仍显示绑定状态
# 手动删除 Headless Service(级联删除不会删 Service)
kubectl delete service nginx
六、关键配置与生产实践总结
| 操作类型 | 核心命令 / 配置 | 关键注意事项 |
|---|---|---|
| 创建 | kubectl create -f web.yaml |
必须先创建 Headless Service |
| 扩容 / 缩容 | kubectl scale sts plicas=N |
有序扩容、反向缩容,依赖前驱 Pod 就绪 |
| 版本更新 | RollingUpdate/OnDelete |
生产环境优先用 RollingUpdate,支持回滚 |
| 金丝雀发布 | partition: N |
仅更新序号 ≥N 的 Pod,适合灰度验证 |
| 删除 | --cascade=false/ 默认 |
PV 永远不会自动删除,需手动清理无用 PV |
| 数据持久化 | volumeClaimTemplates |
确保 StorageClass 已配置,避免 PVC Pending |
七、核心结论
-
StatefulSet 的核心价值是 稳定标识 + 持久存储 + 有序操作,专为数据库、缓存等有状态服务设计;
-
运维关键:牢记「有序创建 / 缩容 / 更新」特性,避免强制终止 Pod 导致数据不一致;
-
存储管理:删除 StatefulSet 后,需手动清理无用 PV,避免存储资源浪费;
-
更新策略:生产环境优先使用
RollingUpdate + partition,实现安全的灰度发布和版本回滚。
通过本文实操,可快速掌握 StatefulSet 从部署到运维的全流程,直接复用命令和配置到生产环境。