半夜三更的,Proxmox VE集群的ceph OSD磁盘挂了

这几天centreon监控频频报警,提示ceph pg 错误,用 ceph health detail 确定不一致的pgs,然后用指令 ceph pg repair pg_num 进行修复,通过查看系统日志,有IO错误,修复一次,能管半天,提醒决策人买新硬盘换上,不理睬,今天终于挂掉了,虽然不影响业务,但资源总体利用率超过70%,一旦节点挂掉,虚拟机连漂移的机会都没有。

Ceph OSD磁盘自己down了,不打算在mount。

系统自己在那里做平衡操作呢!

相关推荐
误入运维泥潭10 小时前
Ceph分布式存储全解析:从了解到使用
ceph·rgw·rbd·mds
mixboot13 天前
Ceph OSD 硬盘重连导致设备名变化
ceph
qq_3129201116 天前
K8s存储类(StorageClass)设计与Ceph集成实战
ceph·容器·kubernetes
1990_super25 天前
虚拟机环境部署Ceph集群的详细指南
ceph
1990_super25 天前
Ceph对象池详解
ceph
1990_super1 个月前
使用ceph-deploy安装和配置RADOS Gateway (RGW)并使用S3访问集群
ceph·gateway
野生技术架构师1 个月前
分布式存储 Ceph 的演进经验 · SOSP 2019
分布式·ceph
mixboot1 个月前
ceph 14.2.22 nautilus Balancer 数据平衡
ceph·balancer·数据平衡
斯普信专业组1 个月前
k8s云原生rook-ceph pvc快照与恢复(下)
ceph·云原生·kubernetes
斯普信专业组1 个月前
k8s云原生rook-ceph pvc快照与恢复(上)
ceph·云原生·kubernetes