vllm推理服务指标监控看板搭建手册

vllm推理服务指标监控看板搭建

组件: prometheus+grafana+vllm-metrics

1.环境准备

1.1 prometheus

安装

bash 复制代码
tar -xvf prometheus-2.54.1.linux-arm64.tar.gz

cd prometheus-2.54.1.linux-arm64

修改prometheus.yml ,新增vllm服务的metric 路径

bash 复制代码
scrape_configs:

  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.

  - job_name: "prometheus"

    # metrics_path defaults to '/metrics'

    # scheme defaults to 'http'.



static_configs:

      - targets: ["localhost:9090"]

  - job_name: "vllm_qwen2.5-7b"

    static_configs:

      - targets: ["127.0.0.1:31005"]

服务启动

bash 复制代码
./prometheus --config.file=prometheus.yml              --storage.tsdb.path=./data              --web.listen-address=:9090              --web.enable-lifecycle

1.2 grafana

下载压缩包,解压后可直接执行

bash 复制代码
wget https://dl.grafana.com/oss/release/grafana-11.4.0.linux-arm64.tar.gz
tar xvf grafana-11.4.0.linux-arm64.tar.gz
cd grafana-11.4.0.linux-arm64

服务启动

bash 复制代码
export GF_SERVER_HTTP_PORT=10028

$ ./bin/grafana-server --config conf/defaults.ini --homepath ./

登陆页面

端口:10028

登陆账号密码:admin/admin (初始密码)

2. 看板配置

2.1 新增数据源

地址栏输入 http://127.0.0.1:10028/connections/datasource

配置Prometheus server

http://127.0.0.1:9090

点击 save保存

2.2 导入仪表盘

地址栏输入 http://30.189.250.94:10028/dashboard/import

上传grafana.json文件

已配置的grafana.json如下:

pronetheus看板模版

3.效果展示

相关推荐
Up九五小庞2 分钟前
本地部署 + Docker 容器化实战:中医舌诊 AI 项目 TongueDiagnosis 部署全记录-九五小庞
人工智能
德尔塔大雨淋6 分钟前
VLLM 中的module PASS 和FUN PASS
linux·服务器·vllm
John_ToDebug24 分钟前
2025年度个人总结:在技术深海中锚定价值,于时代浪潮中重塑自我
人工智能·程序人生
自可乐35 分钟前
n8n全面学习教程:从入门到精通的自动化工作流引擎实践指南
运维·人工智能·学习·自动化
king of code porter39 分钟前
百宝箱企业版搭建智能体应用-创建应用
人工智能·大模型·智能体
HDO清风44 分钟前
CASIA-HWDB2.x 数据集DGRL文件解析(python)
开发语言·人工智能·pytorch·python·目标检测·计算机视觉·restful
策知道1 小时前
依托政府工作报告准备省考【经验贴】
大数据·数据库·人工智能·搜索引擎·政务
工程师老罗1 小时前
Pytorch如何加载和读取VOC数据集用来做目标检测?
人工智能·pytorch·目标检测
测试_AI_一辰1 小时前
Agent & RAG 测试工程05:把 RAG 的检索过程跑清楚:chunk 是什么、怎么来的、怎么被命中的
开发语言·人工智能·功能测试·自动化·ai编程
Henry-SAP1 小时前
SAP(ERP) 组织结构业务视角解析
大数据·人工智能·sap·erp·sap pp