技术栈
gpu状态
Sylvan Ding
7 小时前
运维
·
服务器
·
深度学习
·
监控
·
远程
·
gpu状态
远程主机状态监控-GPU服务器状态监控-深度学习服务器状态监控
⭐️ 推荐文章: Docker+PyCharm远程调试&环境隔离解决方案在本监控系统中,我们采用了Prometheus作为核心监控解决方案,并结合Node Exporter和Grafana构建了一个完整的监控体系。系统的整体架构分为远程主机(remote host: Ubuntu)和本地主机(local host: Windows)两部分,具体部署和组件作用如下: