testground local-grafana 环境排查

local-grafana 环境排查 & 修复流程 给你,当成自己的小手册用就行了 👇


🧭 大思路

local-grafana 相关问题,本质上就是这两类:

  1. 镜像问题 :没有 iptestground/grafana:edge 这个镜像
  2. 容器问题 :有镜像,但 testground-grafana 容器创建/启动失败

以后只要按下面步骤一条条检查,就能搞定。


🧱 步骤 0:看 healthcheck 提示

bash 复制代码
testground healthcheck --runner local:exec --fix

如果看到类似:

text 复制代码
- local-grafana: failed; container not found.
- local-grafana: failed; failed to start container.

就进入下面的排查流程。


① 检查镜像是否存在

bash 复制代码
docker images | grep iptestground/grafana
  • 有输出 ✅ → 跳到②
  • 没有输出 ❌ → 自己 build 一个简单镜像:
bash 复制代码
mkdir -p ~/tg-grafana
cd ~/tg-grafana

cat > Dockerfile << 'EOF'
FROM grafana/grafana:8.0.0
EOF

docker build -t iptestground/grafana:edge .

镜像只要 名字和 tag 对上 就行:iptestground/grafana:edge,内容无所谓,Testground 不检查里面装了啥。


② 确认控制网络存在

bash 复制代码
docker network ls | grep testground-control
  • 有 → OK
  • 没有 → 创建一个:
bash 复制代码
docker network create testground-control

③ 手动运行 testground-grafana 容器

先删掉可能残留的(有就删,没有也不报错):

bash 复制代码
docker rm -f testground-grafana 2>/dev/null || true

然后自己起一个:

bash 复制代码
docker run -d \
  --name testground-grafana \
  --network testground-control \
  -p 3000:3000 \
  iptestground/grafana:edge

关键点有两个:

  • 容器名必须叫 testground-grafana(healthcheck 就是按这个名字检查)
  • 网络必须是 testground-control(和其他组件在同一个网络里)

然后看是否在跑:

bash 复制代码
docker ps | grep testground-grafana

④ 如果容器没起来 → 看日志

如果上一步没看到 Up 状态,就查日志:

bash 复制代码
docker logs testground-grafana

常见问题比如:

  • 端口 3000 冲突(你本机有别的 Grafana 等)
  • 某些挂载路径权限 / 配置问题

根据日志修一下,然后再 docker rm -f + docker run -d 重新起。


⑤ 再跑一次 healthcheck 验证

bash 复制代码
testground healthcheck --runner local:exec --fix

理想结果:

text 复制代码
- local-grafana: ok; container state: running
- local-redis: ok
- local-sync-service: ok
- local-influxdb: ok

看到 ok 就说明环境准备好,可以放心跑:

bash 复制代码
testground run single \
  --plan . \
  --testcase quickstart \
  --instances 1 \
  --builder exec:go \
  --runner local:exec

🧾 给你一个「终极小抄」版本

以后要是又遇到 local-grafana 问题,直接按这几条照抄就行:

bash 复制代码
# 1. 有镜像吗?
docker images | grep iptestground/grafana \
  || (mkdir -p ~/tg-grafana && cd ~/tg-grafana && \
      printf 'FROM grafana/grafana:8.0.0\n' > Dockerfile && \
      docker build -t iptestground/grafana:edge .)

# 2. 有网络吗?
docker network ls | grep testground-control \
  || docker network create testground-control

# 3. 手动起 grafana 容器
docker rm -f testground-grafana 2>/dev/null || true
docker run -d --name testground-grafana \
  --network testground-control \
  -p 3000:3000 \
  iptestground/grafana:edge

# 4. 再 healthcheck 一遍
testground healthcheck --runner local:exec --fix

如果你之后在别的机器上重装 Testground,按这套流程走一遍,基本可以一次性把 local-grafana 环境打通。

相关推荐
AI木马人1 天前
8.人工智能实战:大模型服务“看起来正常却突然变慢”?Prometheus + Grafana + GPU 指标构建全链路监控体系
人工智能·grafana·prometheus
萧行之2 天前
Docker部署Loki+Grafana+Vector实现全服务器日志监控(含N8N/SSH/Fail2ban监控)
服务器·docker·grafana
invicinble2 天前
关于搭建运维监控系统(Prometheus+Grafana)
运维·grafana·prometheus
Elastic 中国社区官方博客3 天前
使用 Observability Migration Platform 将 Datadog 和 Grafana 的仪表板与告警迁移到 Kibana
大数据·elasticsearch·搜索引擎·信息可视化·全文检索·grafana·datalog
sitellla3 天前
Grafana Loki 入门:高效日志聚合系统
其他·grafana
日取其半万世不竭3 天前
用 Netdata 实时监控服务器,比 Prometheus + Grafana 轻量得多
linux·服务器·网络·系统架构·负载均衡·zabbix·grafana
梵得儿SHI5 天前
(第二篇)Spring AI 架构设计与优化:可观察性体系,打造全链路可视化的 AI 运维方案
人工智能·微服务·grafana·prometheus·监控·可观察性·spring ai
何中应7 天前
Grafana如何给列表设置别名
运维·grafana·监控
xmlhcxr9 天前
基于 HAProxy+Keepalived 构建高可用 ZrLog 博客系统及监控平台实现(Prometheus + Grafana)
架构·grafana·prometheus
川石课堂软件测试10 天前
软件测试:典型面试题库
数据库·python·功能测试·mysql·单元测试·grafana·prometheus