半夜三更的，Proxmox VE集群的ceph OSD磁盘挂了

4/5$全真龙门2023-12-22 5:06

这几天centreon监控频频报警，提示ceph pg 错误，用 ceph health detail 确定不一致的pgs，然后用指令 ceph pg repair pg_num 进行修复，通过查看系统日志，有IO错误，修复一次，能管半天，提醒决策人买新硬盘换上，不理睬，今天终于挂掉了，虽然不影响业务，但资源总体利用率超过70%，一旦节点挂掉，虚拟机连漂移的机会都没有。

Ceph OSD磁盘自己down了，不打算在mount。

系统自己在那里做平衡操作呢！

上一篇：LeetCode21. Merge Two Sorted Lists

下一篇：Ceph入门到精通-smartctl 查看硬盘参数

热门推荐

01GitHub 镜像站点 02Codex 接入 DeepSeek API 完整配置文档 03CC-Switch & Claude 基于 Linux 服务器安装使用指南 04【踩坑记录 | 第一篇】微软商店无法使用时，如何手动安装 OpenAI Codex？附`.msix`文件系统错误解决方法 05几个好用的ip纯净度检测网站 06裂开！ChatGPT 居然开始要手机号验证，附详细解决方法 07装上就回不去了：CodeGraph 让 AI 编程效率飙升 92%，它到底做了什么？08用了半年 OpenRouter，我换到了 Ofox.ai — 两个 AI API 聚合平台的真实对比 09【AI】2026 年具身智能模型和世界模型总结 10codex app每次打开重连5次Reconnecting问题解决