K8S集群中部署SkyWalking

1. 环境准备

  • K8S 集群
  • kubectl
  • helm

2. 为什么要部署SkyWalking?

我也不道啊,老板说要咱就得上啊。咦,好像可以看到服务的各项指标,像SLA,Apdex这些,主要是能够进行请求的链路追踪,bug排查的利器。

总之就是不管三七二十一,先整上去。

3. 部署

部署其实很简单,参考这个仓库的内容 github.com/apache/skyw...

3.1 准备配置文件:

yaml 复制代码
oap:
  image:
    tag: 9.7.0
  storageType: elasticsearch
  replicas: 1
  env: 
    SW_CORE_RECORD_DATA_TTL: "10" # 设置记录数据的保留时间
    SW_CORE_METRICS_DATA_TTL: "10" # 经过聚合处理的指标数据的保留时间
    SW_TELEMETRY: "prometheus"
    SW_HEALTH_CHECKER: "default"
    SW_ENABLE_UPDATE_UI_TEMPLATE: "true"
  readinessProbe: 
    tcpSocket:
      port: 12800
    initialDelaySeconds: 50
    periodSeconds: 10
    failureThreshold: 30
  resources:
    requests:
      memory: 2.6Gi

ui:
  image:
    tag: 9.7.0

elasticsearch:
  enabled: true
  replicas: 1
  minimumMasterNodes: 1
  nodeGroup: "single-node"
  persistence: 
    enabled: true
  initResources:
    requests:
      memory: 1.5Gi
  clusterHealthCheckParams: "wait_for_status=yellow&timeout=1s"
  volumeClaimTemplate:
    accessModes: [ "ReadWriteOnce" ]
    storageClassName: ebs-hdd
    resources:
      requests:
        storage: 512Gi

本来我的Skywalking版本是 9.6.0 但是有个bug,Endpoints 页面如果涉及的Endpoint过多就会报错 后面我升级了 9.7.0 版本。

底层的存储组件使用 单节点ES,存储卷我用的是hdd的,因为是测试的,就省着用。对性能有要求的同学可以使用多节点,挂载SSD类型的磁盘。

注意调整这两个参数,SW_CORE_RECORD_DATA_TTL和SW_CORE_METRICS_DATA_TTL。

我使用机械盘,保持10天的数据就到顶了。如果这个值加大,会比较慢。这个根据自己的需求来确定。

3.2 开始部署

shell 复制代码
# helm chat 的版本
export SKYWALKING_RELEASE_VERSION=4.5.0
# helm 的 release name
export SKYWALKING_RELEASE_NAME=skywalking
# k8s 的命名空间
export SKYWALKING_RELEASE_NAMESPACE=skywalking

# 部署
helm install "${SKYWALKING_RELEASE_NAME}" \
  oci://registry-1.docker.io/apache/skywalking-helm \
  --version "${SKYWALKING_RELEASE_VERSION}" \
  -n "${SKYWALKING_RELEASE_NAMESPACE}" -f ./values-my-es.yaml

执行需要一些时间,完成后可以在K8S中看到

ES 的 Stateful Sets

SkyWalking 的 Deployments

3.3 更新

修改配置文件时,需要更新 对应的 helm release

shell 复制代码
export HELM_EXPERIMENTAL_OCI=1
export SKYWALKING_RELEASE_VERSION=4.5.0

helm upgrade -f ./values-my-es.yaml "skywalking" oci://registry-1.docker.io/apache/skywalking-helm --version "${SKYWALKING_RELEASE_VERSION}" -n skywalking

4. 项目集成

接入采用initContainer无侵入方式在K8s集成,原理是共享磁盘。

4.1 增加挂载点

YAML 复制代码
- name: skywalking-agent
  emptyDir: {}

4.2 创建initContainer

yaml 复制代码
initContainers:
- name: agent-container
      image: apache/skywalking-java-agent:9.1.0-alpine
      imagePullPolicy: IfNotPresent
      volumeMounts:
      - name: skywalking-agent
      mountPath: /agent
      command: [ "/bin/sh" ]
      args: [ "-c", "cp -R /skywalking/agent /agent/" ]
- name: skywalking-agent
      emptyDir: {}

4.3 Container 增加skywalking的配置

YAML 复制代码
containers:  
- name: <example-name>
  image: <image>
  ports:
  - containerPort: <port>
  env:
  - name: VA_OPTS
    value: "-Dfile.encoding=utf-8 -Duser.timezone=UTC"
  - name: JAVA_TOOL_OPTIONS
    value: "-javaagent:/skywalking/agent/skywalking-agent.jar"
  - name: SW_AGENT_NAMESPACE
    value: "dev"
  - name: SW_AGENT_NAME
    value: "dev::example-name"
  - name: SW_AGENT_COLLECTOR_BACKEND_SERVICES
    value: "skywalking-skywalking-helm-oap.skywalking.svc.cluster.local:11800"
    
volumeMounts:
- name: skywalking-agent
  mountPath: /skywalking

这样配置之后,启动 deployment 时,会先初始化一个 initContainer,然后在启动核心的 container pod。

完美

Ref

apache/skywalking-helm: Apache SkyWalking Kubernetes Deployment Helm Chart (github.com)

相关推荐
java_cj4 小时前
深入kube-apiserver认证机制:从Bearer Token到mTLS的完整认证链解析
linux·运维·服务器·云原生·容器·kubernetes
qq_452396237 小时前
第十三篇:《K8s 安全基础:RBAC、ServiceAccount、Pod Security》
java·安全·kubernetes
睡不醒男孩0308238 小时前
云原生运维实战:高并发架构下的云原生可观测性、韧性降级与自动化干预体系
数据库·kubernetes·高并发·prometheus·devops·sre·缓存调优
qq_452396239 小时前
第十四篇:《K8s 网络模型与 CNI 插件(Calico、Flannel、Cilium)》
网络·kubernetes·php
Hadoop_Liang9 小时前
Kubernetes 应用 HTTPS 安全访问配置实践
https·kubernetes
java_cj10 小时前
从0到1启动kube-apiserver:深入源码解析API Server启动全流程
docker·容器·kubernetes
Hadoop_Liang19 小时前
使用Kubernetes Gateway API实现域名访问应用
容器·kubernetes·gateway
java_cj1 天前
深入kubectl create源码:从YAML到Pod的完整链路拆解
运维·云原生·容器·kubernetes
万能的知了1 天前
K8s到底需不需要GPU节点?集群资源分配的底层逻辑
云原生·容器·kubernetes
卧室小白1 天前
K8S基础-控制器&deploy&pod回滚更新&service
docker·容器·kubernetes