Proxmox VE 超融合集群销毁Ceph Pool

作者:田逸(formyz)

销毁 Ceph Pool 的目的

一套五节点的Proxmox VE超融合集群,当初为有效利用资源,配备了Nvme高性能磁盘和大容量的SATA机械磁盘(如图所示),高性能Nvme磁盘用于虚拟机的系统盘、数据库的数据存储盘,而大容量的机械盘则用于存储诸如图片、视频、共享数据等对性能要求不高的场景。由于机构的业务发展迅猛,收益较好(个人猜测),决策人打算将现有的机械盘全部更换成Nvme高性能磁盘,而将其另做它用。

销毁 Ceph Pool 的主要步骤

销毁Ceph Pool包括两个大的步骤:销毁Ceph Pool及Ceph OSD。如果不执行OSD的销毁,集群的服务器拔掉硬盘再运行的时候,系统会一直报错。

销毁Ceph Pool必须按照先销毁Ceph Pool ,再销毁Ceph OSD的顺序。如果顺序反了,再逐步销毁Ceph OSD的过程中,还没有被销毁的Ceph OSD会自动做数据平衡,如果销毁的Ceph OSD数量小于Ceph 集群所需要的最少值,系统报错,可能会引起其它问题,让人不安。

具体操作过程

第一步:销毁 Ceph Pool

Proxmox VE 超融合集群Web管理后台,鼠标选定欲销毁的Ceph Pool项,再点击按钮"销毁",如下图所示。

为防止误操作,系统很贴心地给出了一个确认界面,需要手动输入欲销毁的Ceph Pool,才会正式执行销毁操作,如下图所示。

注意,千万不要把默认的那个"device_health_metrics"给销毁了,因为这个再次创建就很费劲了!

销毁掉所选定的Ceph Pool "hdd_pool"后,数据中心"存储"菜单下相对应的同名项自动消失,无需手动执行删除,如下图所示。

第二步:销毁 Ceph OSD

销毁Ceph OSD分三个小步骤:离线OSD磁盘、Down掉OSD磁盘和销毁OSD磁盘。

  1. 离线OSD。Proxmox VE 集群Web管理后台,选定欲操作的磁盘,然后点击界面右上方按钮"Out",注意观察执行完后的状态。
  1. 离线操作成功以后,再继续单击界面右上方按钮"停止"。

为确保操作是正确的,最好确认一下Ceph集群是否在重新平衡OSD数据。可以在Proxmox VE 集群Web管理后台查看,也可以在任意集群节点用命令行"ceph health detail"查看。如果用Web图形界面查看,正常状况应该是一片绿,如下图所示。

如果是命令行方式,正常情况下的输出应该是"HEALTH_OK"。

  1. 选中已经"Out"和"Down"状态的OSD磁盘,单击右上方按钮"更多",再继续单击子菜单"销毁",如图。

按照上述三个步骤,将所有的OSD机械盘下线并销毁。除了图形操作方式外,还可以用命令行。

相关推荐
维尔切6 小时前
Shell 脚本编程:函数
linux·运维·自动化
穷人小水滴6 小时前
胖喵必快 (pmbs): btrfs 自动快照工具 (每分钟快照)
linux·rust
云泽8087 小时前
从ENIAC到Linux:计算机技术与商业模式的协同演进
linux·运维·服务器
wheeldown7 小时前
【Linux】【实战向】Linux 进程替换避坑指南:从理解 bash 阻塞等待,到亲手实现能执行 ls/cd 的 Shell
linux·运维·bash
ZeroNews内网穿透7 小时前
企业远程访问方案选择:何时选内网穿透,何时需要反向代理?
运维·服务器·网络·python·安全
看好多桂花树7 小时前
Nginx 优化
运维·nginx
zyt05027 小时前
四、计算机网络与分布式系统(中)
linux·计算机网络·程序人生
NiKo_W7 小时前
Linux 深入理解权限
linux·运维·服务器
bkspiderx7 小时前
C++时区操作全版本指南(含C++03/C++11-17/C++20)
linux·开发语言·c++·c++20·时区
zzywxc7878 小时前
自动化测试框架是软件测试的核心基础设施,通过预设规则和脚本自动执行测试用例,显著提高测试效率和覆盖率。
运维·人工智能·自动化·prompt·测试用例·流程图