vllm推理服务指标监控看板搭建手册

vllm推理服务指标监控看板搭建

组件: prometheus+grafana+vllm-metrics

1.环境准备

1.1 prometheus

安装

bash 复制代码
tar -xvf prometheus-2.54.1.linux-arm64.tar.gz

cd prometheus-2.54.1.linux-arm64

修改prometheus.yml ,新增vllm服务的metric 路径

bash 复制代码
scrape_configs:

  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.

  - job_name: "prometheus"

    # metrics_path defaults to '/metrics'

    # scheme defaults to 'http'.



static_configs:

      - targets: ["localhost:9090"]

  - job_name: "vllm_qwen2.5-7b"

    static_configs:

      - targets: ["127.0.0.1:31005"]

服务启动

bash 复制代码
./prometheus --config.file=prometheus.yml              --storage.tsdb.path=./data              --web.listen-address=:9090              --web.enable-lifecycle

1.2 grafana

下载压缩包,解压后可直接执行

bash 复制代码
wget https://dl.grafana.com/oss/release/grafana-11.4.0.linux-arm64.tar.gz
tar xvf grafana-11.4.0.linux-arm64.tar.gz
cd grafana-11.4.0.linux-arm64

服务启动

bash 复制代码
export GF_SERVER_HTTP_PORT=10028

$ ./bin/grafana-server --config conf/defaults.ini --homepath ./

登陆页面

端口:10028

登陆账号密码:admin/admin (初始密码)

2. 看板配置

2.1 新增数据源

地址栏输入 http://127.0.0.1:10028/connections/datasource

配置Prometheus server

http://127.0.0.1:9090

点击 save保存

2.2 导入仪表盘

地址栏输入 http://30.189.250.94:10028/dashboard/import

上传grafana.json文件

已配置的grafana.json如下:

pronetheus看板模版

3.效果展示

相关推荐
吴佳浩5 小时前
GPU 编号进阶:CUDA\_VISIBLE\_DEVICES、多进程与容器化陷阱
人工智能·pytorch·python
吴佳浩5 小时前
GPU 编号错乱踩坑指南:PyTorch cuda 编号与 nvidia-smi 不一致
人工智能·pytorch·nvidia
小饕6 小时前
苏格拉底式提问对抗315 AI投毒:实操指南
网络·人工智能
卧蚕土豆6 小时前
【有啥问啥】OpenClaw 安装与使用教程
人工智能·深度学习
GoCodingInMyWay6 小时前
开源好物 26/03
人工智能·开源
AI科技星6 小时前
全尺度角速度统一:基于 v ≡ c 的纯推导与验证
c语言·开发语言·人工智能·opencv·算法·机器学习·数据挖掘
zhangfeng11336 小时前
Windows 的 Git Bash 中使用 md5sum 命令非常简单 md5做文件完整性检测 WinRAR 可以计算文件的 MD5 值
人工智能·windows·git·bash
monsion6 小时前
OpenCode 学习指南
人工智能·vscode·架构
藦卡机器人6 小时前
中国工业机器人发展现状
大数据·人工智能·机器人
破阵子443286 小时前
小米AI新模型全面解析:从MiMo-V2系列到使用指南
人工智能