Ceph集群OSD运维手册:基础操作与节点扩缩容实战

#作者:stackofumbrella

文章目录

一、Ceph集群的OSD基础操作

查看osd的ID编号

$ sudo ceph osd ls

查看OSD的详细信息

$ sudo ceph osd dump

查看OSD的状态信息

$ sudo ceph osd status

查看OSD的统计信息

$ sudo ceph osd stat

查看OSD在主机上的存储信息

$ sudo ceph osd stat

查看OSD延迟的统计信息

$ sudo ceph osd perf

查看各个OSD使用率

$ sudo ceph osd df

集群暂停接收数据

$ sudo ceph osd pause

集群取消暂停

$ sudo ceph osd unpause

OSD写入权重操作

查看默认OSD操作权重值

$ sudo ceph osd crush tree

修改OSD数据操作权重值

$ sudo ceph osd crush reweight osd.2 0

OSD上下线

由于OSD有专门的管理服务器ceph-osd控制,一旦发现被下线会尝试启动它。

如果真的想要永久关闭,则需要关闭对应的ceph-osd进程即可。

临时关闭OSD会自动被拉起

$ sudo ceph osd down 2;sudo ceph osd tree

然后会自动重启

永久关闭

$ sudo ceph orch daemon stop osd.2;sudo ceph osd tree

驱逐OSD设备

驱逐关掉的osd.2,驱逐的本质是对ceph集群数据操作的权重值REWEIGHT重新调整

$ sudo ceph osd out 2

$ sudo ceph osd tree

将驱逐的OSD设备加入到集群

$ sudo ceph osd in 2

$ sudo ceph orch daemon start osd.2;sudo ceph osd tree

二、Ceph集群的OSD节点缩容

OSD缩容实战案例

查看集群OSD状态

$ sudo ceph osd tree

停止需要下线节点的所有OSD守护进程

$ sudo ceph orch daemon stop osd.2

$ sudo ceph osd tree

清理OSD数据和配置

$ sudo ceph osd purge 2 --force

$ sudo ceph osd tree

移除所有OSD后从CRUSH map中删除主机

$ sudo ceph osd crush rm ceph03

$ sudo ceph osd tree

自动驱逐被下线节点的服务组件

$ sudo ceph orch host drain ceph03

OSD设备无法清除,只能通过手动删除

$ sudo ceph orch daemon rm osd.2 --force

$ sudo ceph orch host drain ceph03

删除节点

$ sudo ceph orch host rm ceph03

$ sudo ceph orch host ls

解除ceph对磁盘的占用(在OSD节点上执行)

$ lsblk

$ sudo dmsetup remove ceph--e16939c6--b24f--4e87--b6bd--ca4ddd1dffee-osd--block--b995ab08--d360--4a51--b750--fb193edcba4e

$ lsblk

OSD扩容实战案例

将上面剔除的节点添加到集群

$ sudo ceph orch host add ceph03

擦除磁盘的原有数据

$ sudo ceph orch device zap --force ceph03 /dev/vdb

出现此报错需要到ceph03节点上执行擦除命令

$ sudo wipefs -af /dev/vdb

在管理节点上再次擦除磁盘

$ sudo ceph orch device zap --force ceph03 /dev/vdb

查看设备

$ sudo ceph orch device ls

添加OSD到集群

$ sudo ceph orch daemon add osd ceph03:/dev/vdb

$ sudo ceph osd tree

相关推荐
IT成长日记5 小时前
【Nginx开荒攻略】Nginx虚拟主机配置:从域名、端口到IP的完整指南
linux·运维·服务器·nginx·虚拟主机
taxunjishu5 小时前
DeviceNet 转 Modbus TCP 协议转换在 S7-1200 PLC化工反应釜中的应用
运维·人工智能·物联网·自动化·区块链
迎風吹頭髮7 小时前
Linux内核架构浅谈8-Linux内核与UNIX的传承:设计思想与特性差异
linux·运维·架构
黑马金牌编程7 小时前
Linux 服务器常见的性能调优
linux·运维·服务器·性能优化
tianyuanwo7 小时前
Linux进程管理中的T状态问题分析与解决体系
linux·运维·进程管理·t状态
liuyao_xianhui8 小时前
Linux_基本指令1
linux·运维·服务器
爱吃喵的鲤鱼10 小时前
仿mudou——Connection模块(连接管理)
linux·运维·服务器·开发语言·网络·c++
让子弹飞0210 小时前
永久解决ubuntu网络连接问题
linux·运维·ubuntu
七七七七0712 小时前
【Linux 系统】打开文件和文件系统
linux·运维·spring
ManageEngineITSM14 小时前
IT 服务自动化的时代:让效率与体验共进
运维·数据库·人工智能·自动化·itsm·工单系统