vllm推理服务指标监控看板搭建手册

vllm推理服务指标监控看板搭建

组件: prometheus+grafana+vllm-metrics

1.环境准备

1.1 prometheus

安装

bash 复制代码
tar -xvf prometheus-2.54.1.linux-arm64.tar.gz

cd prometheus-2.54.1.linux-arm64

修改prometheus.yml ,新增vllm服务的metric 路径

bash 复制代码
scrape_configs:

  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.

  - job_name: "prometheus"

    # metrics_path defaults to '/metrics'

    # scheme defaults to 'http'.



static_configs:

      - targets: ["localhost:9090"]

  - job_name: "vllm_qwen2.5-7b"

    static_configs:

      - targets: ["127.0.0.1:31005"]

服务启动

bash 复制代码
./prometheus --config.file=prometheus.yml              --storage.tsdb.path=./data              --web.listen-address=:9090              --web.enable-lifecycle

1.2 grafana

下载压缩包,解压后可直接执行

bash 复制代码
wget https://dl.grafana.com/oss/release/grafana-11.4.0.linux-arm64.tar.gz
tar xvf grafana-11.4.0.linux-arm64.tar.gz
cd grafana-11.4.0.linux-arm64

服务启动

bash 复制代码
export GF_SERVER_HTTP_PORT=10028

$ ./bin/grafana-server --config conf/defaults.ini --homepath ./

登陆页面

端口:10028

登陆账号密码:admin/admin (初始密码)

2. 看板配置

2.1 新增数据源

地址栏输入 http://127.0.0.1:10028/connections/datasource

配置Prometheus server

http://127.0.0.1:9090

点击 save保存

2.2 导入仪表盘

地址栏输入 http://30.189.250.94:10028/dashboard/import

上传grafana.json文件

已配置的grafana.json如下:

pronetheus看板模版

3.效果展示

相关推荐
king王一帅2 小时前
Incremark Solid 版本上线:Vue/React/Svelte/Solid 四大框架,统一体验
前端·javascript·人工智能
泰迪智能科技4 小时前
分享|职业技术培训|数字技术应用工程师快问快答
人工智能
Dxy12393102166 小时前
如何给AI提问:让机器高效理解你的需求
人工智能
少林码僧6 小时前
2.31 机器学习神器项目实战:如何在真实项目中应用XGBoost等算法
人工智能·python·算法·机器学习·ai·数据挖掘
钱彬 (Qian Bin)6 小时前
项目实践15—全球证件智能识别系统(切换为Qwen3-VL-8B-Instruct图文多模态大模型)
人工智能·算法·机器学习·多模态·全球证件识别
没学上了7 小时前
CNNMNIST
人工智能·深度学习
宝贝儿好7 小时前
【强化学习】第六章:无模型控制:在轨MC控制、在轨时序差分学习(Sarsa)、离轨学习(Q-learning)
人工智能·python·深度学习·学习·机器学习·机器人
智驱力人工智能7 小时前
守护流动的规则 基于视觉分析的穿越导流线区检测技术工程实践 交通路口导流区穿越实时预警技术 智慧交通部署指南
人工智能·opencv·安全·目标检测·计算机视觉·cnn·边缘计算
AI产品备案7 小时前
生成式人工智能大模型备案制度与发展要求
人工智能·深度学习·大模型备案·算法备案·大模型登记
AC赳赳老秦7 小时前
DeepSeek 私有化部署避坑指南:敏感数据本地化处理与合规性检测详解
大数据·开发语言·数据库·人工智能·自动化·php·deepseek