ceph pg inconsistent修复(unexpected clone)

问题概述:

ceph -s 显示pg 10.17 inconsistent

且命令ceph pg repair 10.17无法修复,/var/log/ceph/cep-osd.3.log报错内容如下:

pg 10.17 osd [3,4] 权威副本osd:3

repair 10.17 10:e889b16a:::rbd_data.88033092ad95.0000000000000012:b : is an unexpected clone

修复步骤:

0.备份

rados -p ceph-kvm-pool get rbd_data.88033092ad95.0000000000000012 /tmp/rbd_data.88033092ad95.0000000000000012

1.禁止集群均衡

ceph osd set noout

ceph osd set noscrub

ceph osd set nodeep-scrub

2.禁止recover

ceph osd set nobackfill

ceph osd set norebalance

ceph osd set norecover

3.停止osd

systemctl stop ceph-osd@3

4.列出快照

ceph-objectstore-tool --pgid 10.17 \

--data-path /var/lib/ceph/osd/ceph-3/ \

--op list | grep rbd_data.88033092ad95.0000000000000012

5.删除有问题的快照

日志里:rbd_data.88033092ad95.0000000000000012:b : is an unexpected clone

b转为十进制为11,因此需要删除的为snapid为11的快照

ceph-objectstore-tool --pgid 10.17 \

--data-path /var/lib/ceph/osd/ceph-3/ \

'["10.17",{"oid":"rbd_data.88033092ad95.0000000000000012","key":"","snapid":11,"hash":1452118295,"max":0,"pool":10,"namespace":"","max":0}]' \

remove

6.启动osd

systemctl start ceph-osd@3

7.清除标记位

ceph osd unset norecover

ceph osd unset norebalance

ceph osd unset nobackfill

重复处理完全部osd(步骤2~7)

8.deep-scrub

ceph pg deep-scrub 10.17

9.处理完全部pg inconsistent后,清除其余标记位

ceph osd unset noscrub

ceph osd unset nodeep-scrub

ceph osd unset noout

其余指令:

列出不一致的pg:

ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-3/ --type bluestore --op list-pgs

列出不一致的object:

ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-3/ --type bluestore --pgid 10.17 --op list

相关推荐
weixin_453965005 分钟前
[单master节点k8s部署]31.ceph分布式存储(二)
分布式·ceph·kubernetes
weixin_419349791 小时前
windows上安装python环境
windows
天上掉下来个程小白1 小时前
Stream流的中间方法
java·开发语言·windows
暮雪倾风2 小时前
【WPF开发】控件介绍-Grid(网格布局)
windows·wpf
sukalot3 小时前
windows C++-windows C++-使用任务和 XML HTTP 请求进行连接(二)
c++·windows
大道归简4 小时前
Docker 命令从入门到入门:从 Windows 到容器的完美类比
windows·docker·容器
没有余地 EliasJie4 小时前
Windows Ubuntu下搭建深度学习Pytorch训练框架与转换环境TensorRT
pytorch·windows·深度学习·ubuntu·pycharm·conda·tensorflow
程序猿小D6 小时前
第二百六十九节 JPA教程 - JPA查询OrderBy两个属性示例
java·开发语言·数据库·windows·jpa
satan–06 小时前
R语言的下载、安装及环境配置(Rstudio&VSCode)
开发语言·windows·vscode·r语言
学习溢出7 小时前
深入了解 net user 命令:上一次是谁登录的?
windows·网络安全·系统安全