Prometheus+Grafana 基础监控告警体系搭建(一):服务的基本安装

文章目录

  • [1. prometheus 安装](#1. prometheus 安装)
    • [1.1. 下载安装包](#1.1. 下载安装包)
    • [1.2. 基本设置](#1.2. 基本设置)
    • [1.3. 解压安装包](#1.3. 解压安装包)
    • [1.4. 配置 service 启动文件](#1.4. 配置 service 启动文件)
    • [1.5. 启动服务](#1.5. 启动服务)
  • [2. Grafana 安装](#2. Grafana 安装)
    • [2.1. 下载安装包](#2.1. 下载安装包)
    • [2.2. 安装](#2.2. 安装)
    • [2.3. 启动服务](#2.3. 启动服务)
  • [3. 总结一下](#3. 总结一下)

打算重新练下手,免得忘记了,这次内网进行了全面部署演示,以"Prometheus+Grafana"方式进行监控告警,本记录系列不涉及架构理论知识,纯操作记录,理论部分可以参考官方文档即可。

  • 系统平台:Centos 7
  • 安装方式:非容器化
  • 有外网权限

1. prometheus 安装

1.1. 下载安装包

1.2. 基本设置

对于服务器的基本设置,我们一般会做以下调整

  • 关闭selinux
  • 关闭firewalld
  • 配置特定的主机名
  • 配置时间同步

1.3. 解压安装包

shell 复制代码
cd /opt
tar -xf prometheus-2.45.0.linux-amd64.tar.gz
mv prometheus-2.45.0.linux-amd64 prometheus

1.4. 配置 service 启动文件

基于二进制文件的目录位置进行启动文件生成

shell 复制代码
cat <<EOF >/etc/systemd/system/prometheus.service
[Unit]
Description="prometheus"
Documentation=https://prometheus.io/
After=network.target

[Service]
Type=simple
ExecStart=/opt/prometheus/prometheus  --config.file=/opt/prometheus/prometheus.yml --storage.tsdb.path=/opt/prometheus/data --web.enable-lifecycle  --query.lookback-delta=2m 
Restart=on-failure
SuccessExitStatus=0
LimitNOFILE=65536
StandardOutput=syslog
StandardError=syslog
SyslogIdentifier=prometheus

[Install]
WantedBy=multi-user.target
EOF

1.5. 启动服务

shell 复制代码
systemctl daemon-reload
systemctl enable prometheus --now
systemctl status  prometheus

内网访问9090端口验证一下即可:

2. Grafana 安装

2.1. 下载安装包

  • 下载安装包
shell 复制代码
wget https://dl.grafana.com/enterprise/release/grafana-enterprise-9.5.9-1.x86_64.rpm

2.2. 安装

shell 复制代码
yum install grafana-enterprise-9.5.9-1.x86_64.rpm -y

2.3. 启动服务

shell 复制代码
systemctl daemon-reload
systemctl enable grafana-server.service --now

内网访问3000端口验证是否符合我们的预期:(默认账号密码:admin/admin,首次登陆必须修改admin的密码)

3. 总结一下

  • 我们完成了监控体系最重要的2个服务的安装和启动配置工作
  • prometheus 时序数据库,用来存放监控数据的,但是它本身不产生数据,只是一个用来存储的地方,我们后续要使用采集数据的组件来将数据推送到这个地方进行统一存储
  • Grafana 可视化展示prometheus里面的数据
相关推荐
cv-daily25 分钟前
通过docker overlay2目录名查找容器名和容器ID
运维·docker·容器
努力的小T1 小时前
基于 Bash 脚本的系统信息定时收集方案
linux·运维·服务器·网络·云计算·bash
夜光小兔纸2 小时前
Oracle 普通用户连接hang住处理方法
运维·数据库·oracle
liuyunshengsir2 小时前
Spring Boot 使用 Micrometer 集成 Prometheus 监控 Java 应用性能
java·spring boot·prometheus
爱敲代码的边芙2 小时前
Linux:信号的保存[2]
linux·运维·服务器
阿俊仔(摸鱼版)2 小时前
Python 常用运维模块之OS模块篇
运维·开发语言·python·云服务器
工程师焱记2 小时前
Linux 常用命令——系统设置篇(保姆级说明)
linux·运维·服务器
chian-ocean3 小时前
探索Linux中的进程控制:从启动到退出的背后原理
linux·运维·服务器
华纳云IDC服务商3 小时前
常见的备份服务器操作系统如何选择
运维·服务器
wanhengidc3 小时前
网站服务器出现延迟的原因是什么?
运维·服务器