cephadm部署ceph分布式存储集群笔记

  • 1、修改主机名、网卡名

    修改主机名:

    bash 复制代码
    sudo hostnamectl set-hostname 新主机名

    修改网卡名(选做):

    bash 复制代码
    sudo ip link set eth0 name newname
  • 2、关闭防火墙和selinux (选做)

  • 3、关闭交换分区 (选做)

  • 4、修改内核参数和资源限制参数 (选做)

  • 5、配置时间同步服务(NTP)

    bash 复制代码
    sudo apt install ntp

    部署集群环境时,所有主机的时间源都需和ceph-1同步。

  • 6、配置 ssh 免密登录

    在1号主机ceph-1上操作:

    bash 复制代码
    # 生成ssh-key
    ssh-keygen -t rsa
    
    # 将ssh-key复制到2号主机或更多主机
    ssh-copy-id ceph-2
  • 7、安装 docker

    参考以往的博客。

  • 8、安装cephadm

    bash 复制代码
    sudo apt install cephadm

    检查主机是否满足安装ceph集群:

    bash 复制代码
    cephadm check-host --expect-hostname `hostname`
  • 9、初始化mon

    bash 复制代码
    cephadm bootstrap --mon-ip 10.0.3.69 --cluster-network 10.0.3.0/24 --initial-dashboard-user admin --initial-dashboard-password 123456
  • 10、添加主机到集群

    在主机ceph-1上操作:

    • 配置ceph-2主机ssh免密登录:
    bash 复制代码
    ssh-copy-id -f -i /etc/ceph/ceph.pub ceph-2
    • 进入集群环境:
    bash 复制代码
    cephadm shell --fsid cab35cc6-31ff-11ef-8f81-07bce4384981 -c /etc/ceph/ceph.conf -k /etc/ceph/ceph.client.admin.keyring
    • 将主机添加到集群中:
    bash 复制代码
    ceph orch host add ceph-2 10.0.3.69 --labels=mon,mgr
    ceph orch host add ceph-3 10.0.3.70 --labels=mon
    • 查看加入到集群的节点:
    bash 复制代码
    ceph orch host ls
    • 为节点ceph-2、ceph-3添加 _admin 标签:
    bash 复制代码
    shell ceph orch host label add ceph-2 _admin
    shell ceph orch host label add ceph-3 _admin
    • 给 ceph-1 --- ceph-4添加 mon 标签
    bash 复制代码
    ceph orch host label add ceph-1 mon
    ceph orch host label add ceph-2 mon
    ceph orch host label add ceph-3 mon
    ceph orch host label add ceph-4 mon
    • 给 ceph-1、ceph-2添加 mgr 标签
    bash 复制代码
    ceph orch host label add ceph-1 mgr
    ceph orch host label add ceph-2 mgr
    • 列出节点,查看节点上的标签
    bash 复制代码
    ceph orch host ls

    调整 mon 节点的个数

    bash 复制代码
    ceph orch apply mon --placement="4 label:mon"
  • 11、添加 OSD

    • 说明:添加OSD时,建议将磁盘先格式化为无分区的原始磁盘
    bash 复制代码
    DISK="/dev/sdb"
    sgdisk --zap-all $DISK
    dd if=/dev/zero of="$DISK" bs=1M count=100 oflag=direct,dsync
    blkdiscard $DISK
    partprobe $DISK
    • 调整 osd_poll 默认的个数
    bash 复制代码
    ceph config set global osd_pool_default_size 1
    • 查看各节点可用的磁盘
    bash 复制代码
    ceph orch device ls
    • 添加OSD:
    bash 复制代码
    ceph orch daemon add osd ceph01:/dev/sda
  • 12、添加 pool

    bash 复制代码
    ceph osd pool create hddpool 128 128

    列出池

    bash 复制代码
    ceph osd lspools

    创建规则以使用该设备

    bash 复制代码
    ceph osd crush rule create-replicated hdd default host hdd

    查看规则

    bash 复制代码
    ceph osd crush rule ls

    规则应用到池上面

    bash 复制代码
    ceph osd pool set hddpool crush_rule hdd
  • 13、部署MDS元数据服务

    • 创建CephFS池:
    bash 复制代码
    ceph osd pool create cephfs_data 64 64
    ceph osd pool create cephfs_metadata 64 64
    • 设置副本数:
    bash 复制代码
    ceph osd pool set cephfs_data size 1
    ceph osd pool set cephfs_data size 1
    • 列出池:
    bash 复制代码
    ceph osd lspools
    • 为数据池和元数据池创建文件系统
    bash 复制代码
    ceph fs new cephfs cephfs_metadata cephfs_data
    • 使用 ceph orch apply 命令部署 MDS:
    bash 复制代码
    ceph orch apply mds cephfs --placement="1 ceph-1"
    • 查看状态:
    bash 复制代码
    ceph fs ls
    ceph fs status
    • 查看守护进程:
    bash 复制代码
    ceph orch ps --daemon_type=mds
  • 14、dashboard的使用

    查看 dashboard的访问地址:

    bash 复制代码
    ceph mgr services
  • 15.删除节点

    • 获取被删除主机上有哪些守护进程:
    bash 复制代码
    ceph orch ps ceph-4
    • 先排空被删除主机上的所有守护进程
    bash 复制代码
    ceph orch host drain ceph-4
    • 查看被移除的OSD状态:
    bash 复制代码
    ceph orch osd rm status
    • 检查被删除的主机上所有守护进程是否已经从集群中移除:
    bash 复制代码
    ceph orch ps ceph-4
    • 删除主机:
    bash 复制代码
    ceph orch host rm  ceph-4
    • 清理节点:
      在被删除的节点上执行:
    bash 复制代码
    cephadm rm-cluster --fsid 集群id --force
  • 16.ceph mon监视器管理

    bash 复制代码
    ceph orch apply mon --placement="ceph-1 ceph-2 ceph-3"
  • 17、ceph mgr 管理器管理

    • 重启mgr:
    bash 复制代码
    ceh orch restart mgr
    • 添加mgr:
    bash 复制代码
    ceph orch apply mgr --placement="3 ceph-1 ceph-2 ceph-3"
  • 18.使用MDS

    • 安装ceph客户端:
    bash 复制代码
    sudo apt install ceph ceph-common
    • 挂载cephfs:
    bash 复制代码
    mount -t ceph 10.2.3.200:6789:/ ./cephfs -o name=admin,secretfile=/etc/ceph/ceph.client.admin.keyring

    或:

    bash 复制代码
    mount -t ceph 10.2.3.200:6789:/ ./cephfs -o name=admin,secret=AQAQ23Nm81oMGBAACvc1JMckL4zCMSziL6GX9A==
  • 19、k8s中使用cephfs

    参考:https://blog.csdn.net/HYESC/article/details/128039771

    • k8s用到的信息:
    txt 复制代码
    clusterID: 
    "cab35cc6-31ff-11ef-8f81-07bce4384981"
    
    monitors:
    10.2.3.200:6789
    
    user:
    admin
    
    userKey:
    AQCbJ3lmhEw4MhAA6+v/bC9igPjYvV1Sj0b+jA==
    • 创建子卷组:
    bash 复制代码
    ceph fs subvolumegroup create cephfs csi
  • 20、问题解决

    • 关闭pool没有副本的警告:
    bash 复制代码
    ceph config set global mon_warn_on_pool_no_redundancy false
    • ceph状态机undersized+degrated:https://www.jianshu.com/p/0fd446d3e9ff

    • ceph-csi镜像拉取失败解决办法:https://blog.csdn.net/davidzzc/article/details/124868759

相关推荐
萧鼎2 小时前
Python pyzmq 库详解:从入门到高性能分布式通信
开发语言·分布式·python
好望角雾眠3 小时前
第一阶段C#基础-10:集合(Arraylist,list,Dictionary等)
笔记·学习·c#
卡拉叽里呱啦5 小时前
缓存-变更事件捕捉、更新策略、本地缓存和热key问题
分布式·后端·缓存
yatingliu20195 小时前
HiveQL | 个人学习笔记
hive·笔记·sql·学习
郭庆汝5 小时前
CMake概述用法详细笔记
笔记
张人玉5 小时前
XML 序列化与操作详解笔记
xml·前端·笔记
风和日丽 随波逐流5 小时前
java17学习笔记-Deprecate the Applet API for Removal
笔记·学习
淮北也生橘126 小时前
Linux的ALSA音频框架学习笔记
linux·笔记·学习
BD_Marathon7 小时前
Kafka文件存储机制
分布式·kafka
哈哈很哈哈8 小时前
Spark 运行流程核心组件(三)任务执行
大数据·分布式·spark