半夜三更的,Proxmox VE集群的ceph OSD磁盘挂了

这几天centreon监控频频报警,提示ceph pg 错误,用 ceph health detail 确定不一致的pgs,然后用指令 ceph pg repair pg_num 进行修复,通过查看系统日志,有IO错误,修复一次,能管半天,提醒决策人买新硬盘换上,不理睬,今天终于挂掉了,虽然不影响业务,但资源总体利用率超过70%,一旦节点挂掉,虚拟机连漂移的机会都没有。

Ceph OSD磁盘自己down了,不打算在mount。

系统自己在那里做平衡操作呢!

相关推荐
QF_14 天前
debian搭建ceph记录(接入libvirt)
ceph·debian·kvm·libvirt
斯普信专业组1 个月前
Ceph集群OSD运维手册:基础操作与节点扩缩容实战
运维·ceph
时空无限2 个月前
CEPH OSD_SLOW_PING_TIME_FRONT/BACK 警告处理
ceph
云计算运维丁丁2 个月前
ceph集群架构阐述
ceph·架构
liuy52772 个月前
dmsetup 清理ceph osd残留磁盘分区
ceph
斯普信专业组2 个月前
ceph数据迁移数据迁移与bacula配置调整优化实战
前端·ceph·github
斯普信专业组2 个月前
Ceph异地数据同步之-RBD异地同步复制(下)
linux·服务器·ceph
小马爱打代码2 个月前
Kubernetes 中部署 Ceph,构建高可用分布式存储服务
分布式·ceph·kubernetes
斯普信专业组2 个月前
Ceph与Bacula运维实战:数据迁移与备份配置优化指南
运维·ceph·github
野猪佩挤3 个月前
Ceph集群2025(Squid版)导出高可用NFS集群(上集)
java·服务器·ceph