小白成长之路-部署prometheus监控平台

文章目录


一、准备环境

这个可以从github官网下载

查看9090端口号是否被占用,没有的话,解压后可以做链接优化下

并放在后台启动

查看内容:会在终端生成文件

二、部署prometheus服务监控端

导入node这个包,

添加监控信息:

prometheus.yml 文件中添加

重新启动:

访问:

三、监控本地主机

在当前主机上解压 grafana这个软件包

访问:

添加数据源:

仪表板:


相关的数据信息都可以从github上下载

四、监控其他主机

在你想监控的主机上也要导入这个包,还是把他放在后台运行

编写配置文件:(我的9100端口号被占用了,就换成9101了)

重启:

访问:

五、监控数据库

在你想监控的主机上安装mysql:

yum install -y mysql-server

导入mysql安装包:

创建用户并赋予权限:

编写cnf文件:文件应该是 .my.cnf

启动:

添加mysql信息:

再次重启:

导入mysql的json文件:

六、设置grafana告警

修改文件配置

alertmanager.yml:

bash 复制代码
global:
  smtp_smarthost: 'smtp.163.com:25'
  smtp_from: 'z13516052620@163.com'
  smtp_auth_username: 'z13516052620@163.com'
  smtp_auth_password: 'XBTi7jHQRHre6tUm'
  smtp_require_tls: false
route:
  group_by: ['alertname']
  group_wait: 30s
  group_interval: 5m
  repeat_interval: 1h
  receiver: 'default'
receivers:
  - name: 'default'
    email_configs:
    - to: '2191950432@qq.com'
      send_resolved: true
inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']

启动服务:

修改配置文件:

定义告警规则:

添加标签:

查看告警规则:

现在触发规则:关于cpu的:使cpu占用率过高

验证收到邮件:

降低cpu使用率后:

当前HighCPUUsage告警规则处于Normal状态,因为 CPU 使用率没有超过定义的阈值,所以不会发送告警邮件。如果需要测试邮件发送功能,可以手动触发告警或者检查邮件配置。

比如写个死循环触发告警后在停止循环:就会发送恢复正常的邮件

总结

1.后台进程启动后自动退出可以使用如下命令查看报错

prometheus --config.file=/usr/local/prom/prometheus.yml --web.enable-lifecycle

2.prometheus.yml文件格式要正确缩进

相关推荐
是阿楷啊2 天前
Java大厂面试场景:音视频场景中的Spring Boot与微服务实战
spring boot·redis·spring cloud·微服务·grafana·prometheus·java面试
xixingzhe23 天前
Prometheus+Grafana监控服务器
grafana·prometheus
牛奶咖啡133 天前
Prometheus+Grafana构建云原生分布式监控系统(十六) _基于Alertmanager的告警机制(一)
云原生·prometheus·prometheus告警整合·prometheus告警配置·prometheus告警规则·prometheus触发告警·告警规则配置实践
码农小卡拉5 天前
Prometheus 监控 SpringBoot 应用完整教程
spring boot·后端·grafana·prometheus
牛奶咖啡135 天前
Prometheus+Grafana构建云原生分布式监控系统(十五)_Prometheus中PromQL使用(二)
云原生·prometheus·集合运算·对查询结果排序·直方图原理·统计掉线的实例·检查节点或指标是否存在
牛奶咖啡136 天前
Prometheus+Grafana构建云原生分布式监控系统(十四)_Prometheus中PromQL使用(一)
云原生·prometheus·promql·计算一个时间范围内的平均值·将相同数据整合查看整体趋势·计算时间范围内的最大最小比率·向量标量的算术运算
牛奶咖啡137 天前
Prometheus+Grafana构建云原生分布式监控系统(十三)_Prometheus数据模型及其PromQL
云原生·prometheus·prometheus数据类型·promql使用场景·promql表达式解析·promql数据类型·监控系统的方法论与指标
AC赳赳老秦8 天前
外文文献精读:DeepSeek翻译并解析顶会论文核心技术要点
前端·flutter·zookeeper·自动化·rabbitmq·prometheus·deepseek
牛奶咖啡139 天前
Prometheus+Grafana构建云原生分布式监控系统(十二)_基于DNS的服务发现
云原生·prometheus·dns·搭建自己的dns服务器·使用bind搭建dns服务器·配置正向解析·基于dns的服务发现
A-刘晨阳10 天前
Prometheus + Grafana + Alertmanager 实现邮件监控告警及配置告警信息
运维·云计算·grafana·prometheus·监控·邮件