【ceph】ceph中osd报错,have spurious read error

本站以分享各种运维经验和运维所需要的技能为主

《python零基础入门》:python零基础入门学习

《python运维脚本》: python运维脚本实践

《shell》:shell学习

《terraform》持续更新中:terraform_Aws学习零基础入门到最佳实战

《k8》暂未更新

《docker学习》暂未更新

《ceph学习》ceph日常问题解决分享

《日志收集》ELK+各种中间件

《运维日常》运维日常

《linux》运维面试100问

ceph中osd报错,have spurious read error

在使用过程中,有时可能会遇到一些问题,如OSD(Object Storage Daemon)报告"spurious read error"。

"Spurious read error"通常表示在尝试读取某些数据时,数据的校验和与预期不符。这可能是由于硬盘错误、网络问题、内存错误等原因导致的。

以下是一些可能的解决步骤:

  1. 检查硬盘健康状况 :使用SMART工具(如smartctl)检查硬盘的健康状况。如果发现有错误,可能需要更换硬盘。

  2. 检查网络:如果你的Ceph集群跨越了多个网络,检查网络连接是否稳定。网络问题可能会导致数据在传输过程中出错。

  3. 检查内存 :内存错误也可能导致数据错误。你可以使用工具如memtest86+来检查内存是否有问题。

  4. 检查OSD日志 :查看出问题的OSD的日志,可能会有更多的错误信息。你可以使用ceph daemon osd.<id> log命令来查看OSD的日志。

  5. 修复OSD:如果你确定硬盘、网络和内存都没有问题,你可以尝试修复OSD。首先,将出问题的OSD标记为out,然后清除OSD,最后再添加回去。这将触发数据的重新复制,可能会修复错误。

其实ceph的很多报错的排障过程都是这样:

硬件(cpu、内存、磁盘) --- 网络 --- 具体到某个组件的日志

基本上都是盘坏了(可以使用smartctl去查看盘状态),直接换盘就好。

相关推荐
一名路过的小码农5 天前
ceph 18.2.4二次开发,docker镜像制作
ceph·docker·容器
墨水\\9 天前
分布式----Ceph应用(下)
分布式·ceph
大G哥9 天前
基于K8S1.28.2实验rook部署ceph
java·ceph·云原生·容器·kubernetes
石兴稳10 天前
Ceph PG(归置组)的状态说明
ceph
石兴稳10 天前
Ceph层次架构分析
ceph
活老鬼10 天前
Ceph分布式存储
linux·运维·服务器·分布式·ceph
石兴稳12 天前
Ceph client 写入osd 数据的两种方式librbd 和kernel rbd
linux·ceph
石兴稳12 天前
Ceph的pool有两种类型
ceph
运维小文12 天前
ceph的集群管理
ceph·对象存储·存储·ceph集群管理·ceph节点管理
石兴稳13 天前
iSCSI 和SCSI的概述
ceph