ceph修复pg inconsistent( scrub errors)

异常情况

1、收到异常情况如下:

bash 复制代码
OSD_SCRUB_ERRORS 12 scrub errors
PG_DAMAGED Possible data damage: 1 pg inconsistent
    pg 6.d is active+remapped+inconsistent+backfill_wait, acting [5,7,4]

2、查看详细信息

登录后复制

bash 复制代码
#ceph health detail
HEALTH_ERR 12 scrub errors; Possible data damage: 1 pg inconsistent
OSD_SCRUB_ERRORS 12 scrub errors
PG_DAMAGED Possible data damage: 1 pg inconsistent
    pg 6.d is active+remapped+inconsistent+backfill_wait, acting [5,7,4]

2、预处理办法

集群出现pg状态变为 inconsistent 状态,inconsistent状态是pg通过scrub检测到某个或者某些对象在副本之间出现了不一致

解决方法:

1.找到pgid

bash 复制代码
ceph pg dump | grep inconsistent

2.通过repair修复对应的pg

bash 复制代码
ceph pg repair pgid

完成

但是经过观察,并不能解决。

3、我的处理过程

找出异常的 pg,然后到对应的osd所在主机上修复。

bash 复制代码
[root@intelligence-b-10 ~]#  ceph osd find 5
{
    "osd": 5,
    "ip": "10.21.230.91:6802/2032",
    "crush_location": {
        "host": "intelligence-b-12",
        "root": "default"
    }
}
[root@intelligence-b-10 ~]#  ceph osd find 7
{
    "osd": 7,
    "ip": "10.21.230.92:6801/2059",
    "crush_location": {
        "host": "intelligence-b-13",
        "root": "default"
    }
}
[root@intelligence-b-10 ~]#  ceph osd find 4
{
    "osd": 4,
    "ip": "10.21.230.90:6800/2084",
    "crush_location": {
        "host": "intelligence-b-11",
        "root": "default"
    }
}

这里表示是主机intelligence-b-12

然后到 进行修复

1、停止osd

bash 复制代码
systemctl stop ceph-osd@5.service

2、刷入日志

bash 复制代码
ceph-osd -i 5 --flush-journal

3、启动osd

bash 复制代码
systemctl start ceph-osd@5.service

4、修复(一般不需要)

bash 复制代码
ceph pg repair 6.d

5、查看ceph的状态

bash 复制代码
ceph -s
相关推荐
韭菜张师傅3 天前
Ceph环境完全重置指南:彻底清理集群环境
java·网络·ceph
JNU freshman3 天前
Ceph 18(Reef)生产级调优手册
网络·ceph
lisanmengmeng24 天前
ceph 中的OSD
ceph
lisanmengmeng1 个月前
CEPH的基本结构
ceph
lisanmengmeng1 个月前
ceph一些命令
ceph
lisanmengmeng1 个月前
cephadm 17.2.5安装部署 (二)
linux·运维·服务器·ceph
only_Klein1 个月前
kubernetes集群下的分布式存储方案-ceph
ceph·kubernetes·分布式存储
苦逼IT运维1 个月前
Helm 实战指南(四):生产环境 Helm 部署 CVAT 全记录:Ceph 存储、GPU 节点污点调度与 HTTPS 指南
ceph·网络协议·https
大新新大浩浩1 个月前
ceph平台-未及时移除故障osd导致根目录100%问题的故障记录
ceph
北亚数据恢复1 个月前
分布式数据恢复—Ceph+TiDB数据恢复报告
分布式·ceph·数据恢复·tidb·服务器数据恢复·北亚数据恢复·存储数据恢复