解决 N1 ARMBIAN Prometheus 服务启动失败问题

错误日志显示 prometheus.service 启动失败,核心原因是 WorkingDirectory 设置错误和服务文件语法错误。以下是详细解决方案:


检查并修复 WorkingDirectory

确保 WorkingDirectory 路径存在且正确。编辑服务文件:

bash 复制代码
sudo vi /etc/systemd/system/prometheus.service

检查 WorkingDirectory 路径是否与实际路径一致。例如:

ini 复制代码
WorkingDirectory=/sdb1/prometheus

创建目录并设置权限:

bash 复制代码
sudo mkdir -p /sdb1/prometheus
sudo chown -R prometheus:prometheus /sdb1/prometheus

修正服务文件语法

删除所有中文注释,并确保语法正确。示例配置:

ini 复制代码
[Unit]
Description=Prometheus Monitoring System
After=network.target

[Service]
User=prometheus
Group=prometheus
Type=simple
ExecStart=/sdb1/prometheus/prometheus \
    --config.file=/sdb1/prometheus/prometheus.yml \
    --storage.tsdb.path=/sdb1/prometheus/data \
    --web.listen-address=0.0.0.0:9090 \
    --web.enable-lifecycle
Restart=on-failure
RestartSec=5
WorkingDirectory=/sdb1/prometheus

[Install]
WantedBy=multi-user.target

创建 Prometheus 用户

确保用户和组存在:

bash 复制代码
sudo useradd -rs /bin/false prometheus

设置目录权限

确保目录归属和权限正确:

bash 复制代码
sudo chown -R prometheus:prometheus /sdb1/prometheus
sudo chmod +x /sdb1/prometheus/prometheus
sudo mkdir -p /sdb1/prometheus/data
sudo chown prometheus:prometheus /sdb1/prometheus/data

重新加载并启动服务

重新加载配置并启动服务:

bash 复制代码
sudo systemctl daemon-reload
sudo systemctl start prometheus.service
sudo systemctl status prometheus.service

查看日志:

bash 复制代码
sudo journalctl -u prometheus.service --no-pager -n 50

验证服务状态

检查进程和端口:

bash 复制代码
ps aux | grep prometheus
ss -tulnp | grep 9090
curl -v http://localhost:9090

验证服务文件语法

使用 systemd-analyze 检查语法:

bash 复制代码
sudo systemd-analyze verify /etc/systemd/system/prometheus.service

问题总结

问题 解决方案
WorkingDirectory 错误 检查路径并设置权限
服务文件语法错误 删除中文注释,修正语法
用户权限问题 创建用户并设置目录归属

执行完上述步骤后,再次检查服务状态。如果问题仍然存在,提供最新的日志以进一步分析。

相关推荐
DianSan_ERP6 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
呉師傅6 天前
火狐浏览器报错配置文件缺失如何解决#操作技巧#
运维·网络·windows·电脑
2501_946205526 天前
晶圆机器人双臂怎么选型?适配2-12寸晶圆的末端效应器有哪些?
服务器·网络·机器人
linux kernel6 天前
第七部分:高级IO
服务器·网络
数字护盾(和中)6 天前
BAS+ATT&CK:企业主动防御的黄金组合
服务器·网络·数据库
~远在太平洋~6 天前
Debian系统如何删除多余的kernel
linux·网络·debian
unfeeling_6 天前
Keepalived实验
linux·服务器·网络
坐吃山猪6 天前
OpenClaw04_Gateway常见问题
网络·gateway·openclaw
上海云盾商务经理杨杨6 天前
2025年重大网络安全事件回顾与趋势分析
网络·安全·web安全
kylezhao20196 天前
C# 的开闭原则(OCP)在工控上位机开发中的具体应用
网络·c#·开闭原则