【ceph】ceph集群-添加/删除mon

本站以分享各种运维经验和运维所需要的技能为主

《python零基础入门》:python零基础入门学习

《python运维脚本》: python运维脚本实践

《shell》:shell学习

《terraform》持续更新中:terraform_Aws学习零基础入门到最佳实战

《k8》暂未更新

《docker学习》暂未更新

《ceph学习》ceph日常问题解决分享

《日志收集》ELK+各种中间件

《运维日常》运维日常

《linux》运维面试100问

【ceph】ceph集群-添加/删除mon

背景:

当mon出现问题,一般都选择铲掉,再重建,毕竟mon的数量多(mon一般很少出问题)。

过程:

在 Ceph 集群中删除一个有问题的 MON 并添加新的 MON 节点是一个需要谨慎操作的过程,因为 MON 节点负责维护集群的状态和配置信息。下面是删除有问题的 MON 并添加新 MON 到集群的一般步骤:

1. 删除有问题的 MON

  1. 确认 MON 的状态

    使用 ceph mon statceph status 命令查看所有 MON 的状态和它们的健康情况。

  2. 停止有问题的 MON 服务

    根据你的操作系统和部署方式,停止 MON 服务。例如,如果使用 systemd 管理服务,可以使用:

    复制代码
    sudo systemctl stop ceph-mon@<mon-id>
  3. 从 Ceph 配置中删除 MON

    使用以下命令从集群中删除有问题的 MON:

    复制代码
    ceph mon remove <mon-id>
  4. 清理 MON 相关的数据

    删除 MON 节点上关于 Ceph 的相关数据目录,通常位于 /var/lib/ceph/mon/ceph-<mon-id>

2. 添加新的 MON

  1. 准备新的 MON 节点

    确保新的 MON 节点已经安装了 Ceph,并且配置了正确的网络设置和防火墙规则。

  2. 在新节点上创建 MON 目录

    复制代码
    sudo mkdir -p /var/lib/ceph/mon/ceph-<new-mon-id>
  3. 添加新的 MON

    使用 ceph orch apply mon 命令添加新的 MON。这需要你有一个运行的 Orchestrator,如 cephadm。如果你不使用 Orchestrator,可以手动添加 MON:

    复制代码
    ceph auth get mon. -o /tmp/mon.keyring
    ceph mon getmap -o /tmp/monmap
    ceph-mon --mkfs -i <new-mon-id> --monmap /tmp/monmap --keyring /tmp/mon.keyring
    sudo systemctl start ceph-mon@<new-mon-id>
  4. 让集群知晓新的 MON

    更新 Ceph 的配置文件和相关的服务,以确保集群中的其他节点知道新的 MON 节点。你可能需要编辑 /etc/ceph/ceph.conf 文件或使用 Ceph Orchestrator 自动处理这些更改。

  5. 验证新的 MON 状态

    使用 ceph -s 查看集群状态,确认新的 MON 正在运行并且集群状态为 HEALTH_OK。

注意事项

  • 在操作过程中,确保 Ceph 集群中始终有足够的 MON 节点在运行,以维持集群的稳定和高可用性。
  • 在删除和添加 MON 之前,最好先备份相关的配置文件和关键数据。
  • 确保所有操作都在集群的维护窗口内执行,以最小化对服务的影响。

通过这些步骤,你可以安全地从 Ceph 集群中移除有问题的 MON 并添加新的 MON,以恢复和保持集群的健康状态。

---补充:不用重启任何进程,但是ceph.conf要更新新的Mon的信息

相关推荐
自由且自律1 天前
ceph实战,基于docker部署
运维·ceph·docker·容器·云计算
老wang你好3 天前
Ceph存储全攻略:RBD、CephFS与RGW详解
ceph
珂玥c6 天前
Ceph集群新增osd
ceph
老wang你好6 天前
Ceph分布式存储系统全解析
ceph
一个行走的民19 天前
分布式系统中 Map 增量(Delta)是否需要持久化
ceph
一个行走的民21 天前
BlueStore 核心原理与关键机制
ceph
奋斗的小青年I23 天前
Proxmox VE Ceph 超融合集群落地实战
windows·ceph·vmware·pve·超融合·proxmox
一个行走的民23 天前
深度剖析 Ceph PG 分裂机制:原理、底层、实操、影响、线上避坑(最全完整版)
ceph·算法
一个行走的民23 天前
Ceph 核心概念精讲:彻底搞懂 PG、PGP、pg_num、pgp_num
ceph
Mr.王8351 个月前
Kubernetes宿主机本地盘池化管理
ceph·云原生·容器·kubernetes