在CSDN学Golang云原生(监控解决方案Prometheus)

一,记录规则配置

在golang云原生中,通常使用日志库记录应用程序的日志。其中比较常见的有logrus、zap等日志库。这些库一般支持自定义的输出格式和级别,可以根据需要进行配置。

对于云原生应用程序,我们通常会采用容器化技术将其部署到容器集群中。为了方便管理和监控应用程序的运行状态,我们需要将其日志输出到标准输出流或者标准错误流,并且按照一定的规则格式化输出内容。例如Kubernetes就规定了Container Logging Best Practices,在此基础上提供了多种处理日志的方式,如Fluentd、Elasticsearch+Kibana等。

在golang云原生中,我们可以通过以下方式配置记录规则:

  1. 使用第三方日志库

在使用第三方日志库时,可以通过设置Formatter属性来指定输出格式和级别。例如,在使用logrus时,我们可以设置:

import (
    "github.com/sirupsen/logrus"
)

func main() {
    log := logrus.New()

    // 设置Formatter
    formatter := &logrus.JSONFormatter{
        TimestampFormat: "2006-01-02 15:04:05",
    }
    log.Formatter = formatter

    // 设置Level
    log.Level = logrus.DebugLevel

    // 输出日志
    log.Info("hello world")
}
  1. 直接使用标准包

如果不想使用第三方包,则可以直接使用golang标准库中的log包进行日志输出。例如:

import (
    "log"
)

func main() {
    // 输出到标准错误流
    log.SetOutput(os.Stderr)

    // 设置前缀和标记
    log.SetPrefix("[myapp] ")
    log.SetFlags(log.Ldate | log.Ltime | log.Lmicroseconds)

    // 输出日志
    log.Println("hello world")
}

需要注意的是,使用log包输出到标准错误流时,需要将日志级别设置为log.PanicLevel或者log.FatalLevel,否则在Kubernetes容器中无法正确处理。

  1. 配置容器日志

对于Kubernetes集群来说,我们可以通过修改PodSpec中的配置项来指定应用程序的日志输出规则。例如,在Deployment或者StatefulSet对象的yaml文件中加入以下内容:

apiVersion: apps/v1beta2
kind: Deployment
metadata:
  name: myapp-deployment
spec:
  replicas: 1
  selector:
    matchLabels:
      app: myapp
  template:
    metadata:
      labels:
        app: myapp
    spec:
      containers:
      - name: myapp-container
        image: myregistry/myapp:v1.0.0
        ports:
        - containerPort: 8080
        
        # 配置容器日志输出规则 
        volumeMounts:
          - name: logs-volume  
            mountPath: /var/log/myapp
        
        # 定义volume以便将日志文件挂载到宿主机上        
        volumes:
          - name: logs-volume   
            emptyDir: {}

在上述配置中,我们首先定义了一个名为logs-volume的Volume,并将其挂载到容器中的/var/log/myapp目录下。然后,在容器的定义中,通过设置volumeMounts属性来将该Volume挂载到指定目录。

最后,在应用程序中,可以通过直接向标准输出流或者标准错误流输出日志,即可将日志记录到位于宿主机上的日志文件中:

import (
    "log"
)

func main() {
    // 输出到标准错误流
    log.SetOutput(os.Stderr)

    // 设置前缀和标记
    log.SetPrefix("[myapp] ")
    log.SetFlags(log.Ldate | log.Ltime | log.Lmicroseconds)

    // 输出日志
    log.Println("hello world")
}

需要注意的是,Kubernetes支持多种处理容器日志的方式,例如使用Fluentd、Elasticsearch+Kibana等工具对容器日志进行收集和分析。因此,在实际应用中还需要根据实际情况进行相应的配置。

二,报警规则配置

在golang云原生应用中,我们通常使用监控系统对应用程序进行实时监控,并且在出现异常情况时触发报警。常见的监控系统包括Prometheus、Zabbix等。

以下是一些常见的报警规则配置方法:

  1. Prometheus

Prometheus是一个开源的监控和报警工具,可以通过其提供的Alertmanager组件进行报警。Alertmanager可以根据Prometheus收集到的指标数据和用户定义的告警规则来判断是否需要发送告警信息。

首先,需要定义一条或多条告警规则,并将其保存在rules文件中。例如:

groups:
- name: myapp.rules
  rules:
  - alert: HighErrorRate
    expr: sum(rate(http_request_duration_seconds_count{job="myapp"}[5m])) by (handler) > 0.5
    for: 10m
    labels:
      severity: warning
    annotations:
      summary: "High request latency"
      description: "{{ $labels.handler }} has high request latency"

在上述告警规则中,我们定义了一个名为HighErrorRate的告警规则,该规则会检测http请求处理时间是否超过0.5秒,并且持续10分钟以上。如果符合条件,则会发送一条warning级别的告警消息。

然后,在Prometheus配置文件中,我们需要将该rules文件引入进来,并且设置相应的alerting_rules属性。例如:

rule_files:
  - /etc/prometheus/rules/*.rules

alerting:
  alertmanagers:
  - static_configs:
    - targets: ['localhost:9093']

最后,在Alertmanager配置文件中,我们需要定义告警规则与报警接收方式之间的映射关系。例如:

route:
  group_by: ['alertname']
  receiver: 'default'
receivers:
- name: 'default'
  email_configs:
  - to: 'admin@example.com'

在上述配置中,我们将所有告警规则都归类到同一个组中,并且指定了默认的报警接收方式为发送邮件给admin@example.com

  1. Zabbix

Zabbix是一款开源的企业级监控系统,也可以用于进行告警。通过在Zabbix Server中创建相应的监控项和触发器,当监控项的值满足触发器条件时就会触发告警。

首先,在Zabbix Web界面中创建一个新的触发器,并设置相应的条件和阈值。例如:

{myapp.server1:http_requests.avg(5m)}>10

在上述触发器中,我们设置了一个名为http_requests的监控项,并计算其过去5分钟内请求平均值是否大于10。如果满足该条件,则会触发告警。

然后,在Zabbix Server端创建一个新的Action并指定相应的通知方式。例如:

  • Name: Send message to Admins
  • Conditions: Trigger value = PROBLEM
  • Operations: Send message to user "Admin", with subject "MyApp alert" and body "{TRIGGER.NAME}: {TRIGGER.STATUS}"
  • Recovery operations: Send message to user "Admin", with subject "MyApp recovery" and body "{TRIGGER.NAME} recovered"

在上述Action中,我们指定了当触发器值为PROBLEM时,发送消息给用户Admin,并设置相应的主题和内容。

需要注意的是,Zabbix支持多种通知方式,如邮件、短信等。因此,在实际应用中还需要根据实际情况进行相应的配置。

三,PromQL查询语句

PromQL是Prometheus的查询语言,可以用于从Prometheus中查询和分析数据。以下是一些常见的Golang云原生PromQL查询语句:

  1. 查询CPU使用率

    sum(rate(process_cpu_seconds_total{job="myapp"}[5m])) by (instance)

上述查询语句用于计算过去5分钟内各实例的CPU使用率,并按照实例进行汇总。其中,process_cpu_seconds_total是一个指标,表示进程在CPU上花费的时间。

  1. 查询内存使用量

    sum(container_memory_usage_bytes{image!="", container_name!=""}) by (container_name)

上述查询语句用于计算所有容器当前的内存使用量,并按照容器名称进行汇总。其中,container_memory_usage_bytes是一个指标,表示容器当前使用的内存大小。

  1. 查询HTTP请求情况

    rate(http_requests_total{job="myapp", handler="/api/v1/users"}[5m])

上述查询语句用于计算过去5分钟内处理/api/v1/users接口请求的速率。其中,http_requests_total是一个指标,表示HTTP请求数量。

  1. 查询响应时间分布情况

    histogram_quantile(0.95, sum(rate(http_request_duration_seconds_bucket{job="myapp"}[1m])) by (le))

上述查询语句用于计算过去1分钟内各档位HTTP响应时间(如小于100ms、200ms等)的速率,并计算95%分位点的响应时间。其中,http_request_duration_seconds_bucket是一个指标,表示HTTP请求处理时间。

需要注意的是,PromQL语法较为复杂,以上查询语句仅供参考。在实际使用中,还需结合具体场景进行相应的调整和优化。

四,influxdb远程数据中心配置

在Golang云原生应用中使用InfluxDB进行数据存储,如果需要实现远程数据中心配置,则需要进行以下步骤:

  1. 在InfluxDB服务器上创建数据库。

首先,在远程数据中心的InfluxDB服务器上创建一个数据库。可以使用influx命令行工具或者Web管理界面来创建。

  1. 安装InfluxDB Go客户端库。

在Golang项目中,使用InfluxDB Go客户端库可以方便地进行与InfluxDB的交互。可以通过以下命令来安装该库:

go get github.com/influxdata/influxdb-client-go
  1. 配置连接信息

在Golang应用程序中,通过如下方式设置连接信息:

package main

import (
    "fmt"
    "github.com/influxdata/influxdb-client-go"
)

func main() {
    // 设置连接信息
    client := influxdb2.NewClientWithOptions("http://my-remote-influx-server:8086", "my-token",
      influxdb2.DefaultOptions().SetBatchSize(2000).SetFlushInterval(10000))

    defer client.Close()

    // 连接到指定数据库
    writeAPI := client.WriteAPIBlocking("", "my-database")

    // 写入数据
    p := influxdb2.NewPoint("my-measurement",
        map[string]string{"key": "value"},
        map[string]interface{}{"field1": 1.0, "field2": int64(5)},
        time.Now())
    writeAPI.WritePoint(context.Background(), p)

}

其中,第一行代码指定了要连接到的远程数据中心InfluxDB服务器的地址和端口号;第二行代码使用访问令牌进行身份验证。

  1. 写入数据

通过WriteAPI接口可以方便地向指定数据库写入数据,例如:

p := influxdb2.NewPoint("my-measurement",
    map[string]string{"key": "value"},
    map[string]interface{}{"field1": 1.0, "field2": int64(5)},
    time.Now())
writeAPI.WritePoint(context.Background(), p)

上述代码表示向名为my-measurement的测量点中写入一个包含两个字段的记录。其中,第三个参数是一个键值对形式的对象,表示要写入的字段及其对应的值。

需要注意的是,在生产环境下,还需考虑诸如重试机制、错误处理等因素。

Golang云原生学习路线图、教学视频、文档资料、面试题资料(资料包括C/C++、K8s、golang项目实战、gRPC、Docker、DevOps等)免费分享 有需要的可以加qun:793221798领取

五,报警信息配置管理

在Golang云原生应用程序中,可以使用Prometheus作为监控和报警的工具,通过配置Prometheus告警规则文件以及Alertmanager配置文件来实现报警信息的管理。下面是一个简单的示例:

  1. 配置Prometheus告警规则

首先,在Prometheus服务器上创建一个告警规则文件prometheus.rules.yml,并将其放置到指定目录中。例如:

groups:
- name: my-rules
  rules:
  - alert: HighRequestRate
    expr: sum(rate(http_requests_total{job="my-service"}[5m])) > 100
    for: 1m
    labels:
      severity: warning
    annotations:
      summary: "High request rate detected"
      description: "The HTTP request rate is too high ({{ $value }} requests/minute)."

上述代码表示当5分钟内HTTP请求速率超过100个/分钟时触发告警,并在持续1分钟后自动解除。同时,该告警级别为warning。

  1. 配置Alertmanager

接下来,在Alertmanager服务器上创建一个配置文件alertmanager.yml,并将其放置到指定目录中。例如:

global:
  resolve_timeout: 5m

route:
  group_by: ['alertname', 'severity']
  group_wait: 30s
  group_interval: 5m
  repeat_interval: 12h

receivers:
- name: 'slack-webhook'
  slack_configs:
    - channel: '#alerts'
      send_resolved: true
      title_link: 'http://prometheus-server:9090/'
      username: 'Prometheus'
      api_url: 'https://hooks.slack.com/services/T00000000/B00000000/XXXXXXXXXXXXXXXXXXXXXXXX'

上述代码表示使用Slack作为报警接收渠道,并配置了一个名为slack-webhook的接收器,用于将告警信息发送到指定的Slack频道中。需要注意的是,其中的api_url参数需要根据实际情况进行修改。

  1. 在Golang应用程序中引入Prometheus客户端库

在Golang应用程序中,通过如下方式引入Prometheus客户端库:

import "github.com/prometheus/client_golang/prometheus"
  1. 在Golang应用程序中添加监控指标

通过Prometheus客户端库,可以方便地向Prometheus服务器注册监控指标。例如:

httpRequestsTotal := prometheus.NewCounterVec(prometheus.CounterOpts{
    Name: "http_requests_total",
    Help: "The total number of HTTP requests.",
}, []string{"method", "status"})

prometheus.MustRegister(httpRequestsTotal)

http.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) {
    // 处理HTTP请求
    httpRequestsTotal.WithLabelValues(r.Method, strconv.Itoa(statusCode)).Inc()
})

上述代码表示定义了一个名为http_requests_total的计数器类型监控指标,并在HTTP请求处理函数中对其进行更新。

  1. 启动Alertmanager和Prometheus服务器

最后,在启动Alertmanager和Prometheus服务器时,需要分别指定前面创建的配置文件路径。例如:

$ prometheus --config.file=prometheus.yml
$ alertmanager --config.file=alertmanager.yml

在启动后,Prometheus服务器将会按照规则文件中的设置进行监控,并在满足告警条件时向Alertmanager发送报警信息。Alertmanager收到报警信息后,将根据配置文件中的设置将其发送至指定接收器中。

六,自定义应用程序指标

在Golang云原生应用程序中,可以使用Prometheus客户端库来定义自定义的监控指标。下面是一个简单的示例:

  1. 引入Prometheus客户端库

在Golang应用程序中引入Prometheus客户端库:

import (
    "github.com/prometheus/client_golang/prometheus"
    "github.com/prometheus/client_golang/prometheus/promauto"
)
  1. 定义自定义监控指标

使用promauto.NewCounterVec()方法创建一个计数器类型的监控指标,并为其设置标签和描述信息。

var (
    myCustomMetric = promauto.NewCounterVec(prometheus.CounterOpts{
        Name: "my_custom_metric",
        Help: "This is my custom metric.",
    }, []string{"status_code"})
)

上述代码表示创建了一个名为my_custom_metric的计数器类型监控指标,并为其设置了一个名为status_code的标签。

  1. 在应用程序中更新监控指标

在应用程序处理请求或其他相关操作时,通过调用监控指标的相应方法来更新其值。例如:

http.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) {
    // 处理HTTP请求
    statusCode := 200 // 假设返回状态码为200
    myCustomMetric.WithLabelValues(strconv.Itoa(statusCode)).Inc()
})

上述代码表示在处理HTTP请求时,根据实际情况更新了自定义的监控指标值。

  1. 启动Prometheus服务器

最后,在启动Prometheus服务器时,需要注册之前定义的自定义监控指标。例如:

prometheus.MustRegister(myCustomMetric)

在启动后,Prometheus服务器将会按照配置文件中的设置进行监控,并收集和记录应用程序中定义的所有监控指标。可以通过访问http://localhost:9090/metrics来查看当前收集到的所有监控指标信息。

相关推荐
运维&陈同学1 小时前
【Beats01】企业级日志分析系统ELK之Metricbeat与Heartbeat 监控
运维·elk·elasticsearch·云原生·kibana·heartbeat·metricbeat
程序猿-瑞瑞1 小时前
24 go语言(golang) - gorm框架安装及使用案例详解
开发语言·后端·golang·gorm
慕城南风10 小时前
Go语言中的defer,panic,recover 与错误处理
golang·go
有一个好名字13 小时前
zookeeper分布式锁模拟12306买票
分布式·zookeeper·云原生
张声录116 小时前
【Prometheus】【实战篇(七)】在 Grafana 中配置数据源并使用 Prometheus Node Exporter
grafana·prometheus
Anna_Tong16 小时前
云原生大数据计算服务 MaxCompute 是什么?
大数据·阿里云·云原生·maxcompute·odps
运维&陈同学16 小时前
【模块一】kubernetes容器编排进阶实战之基于velero及minio实现etcd数据备份与恢复
数据库·后端·云原生·容器·kubernetes·etcd·minio·velero
泰勒今天不想展开17 小时前
jvm接入prometheus监控
jvm·windows·prometheus
LeonNo1118 小时前
golang , chan学习
开发语言·学习·golang
龙门吹雪18 小时前
GO语言基础面试题
golang·面试题·map·channel·