一、Ceph知识点学习
Ceph知识点学习:https://www.cnblogs.com/happy-king/p/9207509.html
二、部署分布式存储Ceph
一)设置yum源
在全部控制与计算节点设置epel与ceph yum源
epel源:repo安装包下载_开源镜像站-阿里云
ceph源:ceph安装包下载_开源镜像站-阿里云
1、设置yum源
wget -O /etc/yum.repos.d/epel-7.repo http://mirrors.aliyun.com/repo/epel-7.repo
cat>/etc/yum.repos.d/ceph.repo<<EOF
[ceph]
name=ceph
baseurl=http://mirrors.aliyun.com/ceph/rpm-luminous/el7/x86_64/
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=http://mirrors.aliyun.com/ceph/keys/release.asc
[ceph-noarch]
name=cephnoarch
baseurl=http://mirrors.aliyun.com/ceph/rpm-luminous/el7/noarch/
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=http://mirrors.aliyun.com/ceph/keys/release.asc
[ceph-source]
name=ceph-source
baseurl=http://mirrors.aliyun.com/ceph/rpm-luminous/el7/SRPMS/
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=http://mirrors.aliyun.com/ceph/keys/release.asc
EOF
2、重新加载yum源
yum clean all
yum makecache
3、 查看yum源
yum repolist
二)基础环境,如hosts,时间同步ntp,开放端口iptables等相关操作
初始化环境:https://www.cnblogs.com/happy-king/p/9595447.html#_label0
三)创建用户
在全部控制与计算节点操作
1、创建用户
useradd -d /home/ceph -m cephde
echo cephde|passwd --stdin cephde
echo 'cephde ALL=(ALL) NOPASSWD: ALL'>>/etc/sudoers
2、用户赋权
su - cephde
$ echo "cephde ALL = (root) NOPASSWD:ALL" | sudo tee /etc/sudoers.d/cephde
[sudo] password for cephde:cephde
sudo chmod 0440 /etc/sudoers.d/cephde
四)设置ssh免密登陆
- ceph-deploy不支持密码输入,需要在所有控制节点 生成ssh秘钥,并将公钥分发到各ceph节点(控制节点和存储节点);
- 在用户cephde下生成秘钥,不能使用sudo或root用户;
- 默认在用户目录下生成~/.ssh目录,含生成的秘钥对;
- "Enter passphrase"时,回车,口令为空;
- 另外3个控制节点均设置为ceph管理节点,应该使控制管理节点都可以ssh免密登陆到其他所有控制与存储节点
1、生成秘钥对
# su - cephde
$ ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/home/ceph/.ssh/id_rsa):
Created directory '/home/ceph/.ssh'.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /home/ceph/.ssh/id_rsa.
Your public key has been saved in /home/ceph/.ssh/id_rsa.pub.
The key fingerprint is:
1e:a8:cd:c7:45:a9:e0:ef:01:6a:d2:0e:46:a5:8c:d5 cephde@controller03
The key's randomart image is:
+--[ RSA 2048]----+
| |
| . . |
| . E . o |
| + o . o o |
|. + + S . |
| . . = = o |
| + = o * |
| . = o . |
| . . |
+-----------------+
2、分发公钥
- 前提是各控制与存储节点已生成相关用户;
- 分发成功后,在~/.ssh/下生成known_hosts文件,记录相关登陆信息;
- 3个控制节点均设置为ceph管理节点,应该使控制管理节点都可以ssh免密登陆到其他所有控制与存储节点
免交互批量发送公钥脚本: /opt/scripts/shell/ssh-copy.sh (注意需要安装sshpass)
免交互批量发送公钥
在三个控制节点执行(注意使用cephde用户执行脚本)
3、设置环境变量(optional(三个控制节点))
在root账号主目录下,生成~/.ssh/config文件,这样在控制管理节点上执行"ceph-deploy"时可不切换用户或指定"--username {username}";
每个节点把自己去掉
/root/.ssh/config
五)安装ceph-deploy
在规划的全部控制管理节点安装ceph-deploy工具
yum install ceph-deploy -y
六)创建ceph集群
在任意控制节点执行
1、创建集群
- 在cephde账户下操作,切忌使用sudo操作;
- 在管理节点上生成一个目录用于存放集群相关配置文件
su - cephde
mkdir cephcluster
** 后续ceph-deploy相关操作全部在所创建的目录执行**
将规划中的MON(monitor)节点纳入集群,即创建集群
cd ~/cephcluster/
ceph-deploy new controller01 controller02 controller03
2、修改集群配置文件
- 生成集群后在集群目录下生成3个文件,其中ceph.conf即是配置文件;
- 默认可不修改,为使服务按规划启动,可做适当修改;
- 以下红色字体部分是在默认生成的conf文件上新增的配置
上边命令生成的ceph.conf
ceph.conf
修改ceph.conf文件
[global]
fsid = 74082074-0322-460a-b962-436fe36f8e7b
mon_initial_members = controller01, controller02, controller03
mon_host = 10.20.9.189,10.20.9.190,10.20.9.45
auth_cluster_required = cephx
auth_service_required = cephx
auth_client_required = cephx
# public network:前端mon网络,client访问网络;确保public network与mon_host在相同网段,否则初始化时可能会有错误;
# cluster network:后端osd心跳,数据/流复制恢复等网络
public_network = 10.20.9.0/24
cluster_network = 10.0.0.0/24
# 默认的副本数为3,实验环境变更为2
osd_pool_default_size = 2
# 默认保护机制不允许删除pool,根据情况设置
mon_allow_pool_delete = true
七)安装ceph
** 在全部控制管理与存储节点安装ceph**
理论上在控制节点的ceph集群目录使用ceph-deploy可统一安装,命令:ceph-deploy install controller01 controller02 controller03 compute01 compute02 compute03;
但由于网速原因大概率会失败,可在各存储节点独立安装ceph与ceph-radosgw
yum install -y ceph ceph-radosgw
查看版本
[cephde@controller01 cephcluster]$ ceph -v
ceph version 12.2.8 (ae699615bac534ea496ee965ac6192cb7e0e07c0) luminous (stable)
八)初始化ceph_mon
1、初始化monitor
在任意控制管理节点操作(若/etc/ceph/ceph.conf文件存在,需加上--overwrite-conf 参数)
ceph-deploy mon create-initial
1、下面是正常情况
执行完,最后返回如下内容(说明配置没有问题)
............................................................................
[controller01][INFO ] Running command: sudo /usr/bin/ceph --connect-timeout=25 --cluster=ceph --name mon. --keyring=/var/lib/ceph/mon/ceph-controller01/keyring auth get-or-create client.bootstrap-rgw mon allow profile bootstrap-rgw
[ceph_deploy.gatherkeys][INFO ] Storing ceph.client.admin.keyring
[ceph_deploy.gatherkeys][INFO ] Storing ceph.bootstrap-mds.keyring
[ceph_deploy.gatherkeys][INFO ] Storing ceph.bootstrap-mgr.keyring
[ceph_deploy.gatherkeys][INFO ] keyring 'ceph.mon.keyring' already exists
[ceph_deploy.gatherkeys][INFO ] Storing ceph.bootstrap-osd.keyring
[ceph_deploy.gatherkeys][INFO ] Storing ceph.bootstrap-rgw.keyring
[ceph_deploy.gatherkeys][INFO ] Destroy temp directory /tmp/tmpbCEBnS
执行完后,在当前目录下多了如下五个文件
2、下面是报错情况
报错
[controller02][WARNING] The service command supports only basic LSB actions (start, stop, restart, try-restart, reload, force-reload, status). For other actions, please try to use systemctl.
[controller02][ERROR ] RuntimeError: command returned non-zero exit status: 2
[ceph_deploy.mon][ERROR ] Failed to execute command: /usr/sbin/service ceph -c /etc/ceph/ceph.conf start mon.controller02
[ceph_deploy.mon][DEBUG ] detecting platform for host controller03 ...
报错原因:epel中的ceph-deploy版本过低,从ceph官网下载最新版即可。
Index of /rpm-kraken/el7/noarch/
2、查看状态
在所有控制节点验证(换成对应的主机名或者使用hostname -s)
systemctl status ceph-mon@controller01
九)分发ceph.conf与秘钥
- 分发ceph配置文件与秘钥到其他控制管理节点与存储节点;
- 注意分发节点本身也需要包含在内,默认没有秘钥文件,需要分发;
- 如果被分发节点已经配置文件(统一变更配置文件场景),可以使用如下命令:
ceph-deploy --overwrite-conf admin xxx
分发的配置文件与秘钥在各节点/etc/ceph/目录(若其他节点原来存在配置文件,需要加上--overwrite-conf参数)
ceph-deploy --overwrite-conf admin controller01 controller02 controller03 compute01 compute02
十)安装ceph_mgr
1、安装mgr
任意控制节点操作
luminous版本必须安装mgr(dashboard)
ceph-deploy mgr create controller01:controller01_mgr controller02:controller02_mgr controller03:controller03_mgr
查看状态
systemctl status ceph-mgr@controller01_mgr
sudo netstat -tunlp | grep mgr
2、启动mgr
任意控制节点操作
- 可查看mgr默认开启的服务:(sudo) ceph mgr module ls;
- 默认dashboard服务在可开启列表中,但并未启动,需要手工开启
sudo ceph mgr module enable dashboard
dashboard服务已开启,默认监听全部地址的tcp7000端口
若想修改地址和端口,如下操作即可
如果需要设置dashboard的监听地址与端口,如下:
设置监听地址:(sudo) ceph config-key put mgr/dashboard/server_addr x.x.x.x
设置监听端口:(sudo) ceph config-key put mgr/dashboard/server_port x
验证服务
sudo netstat -tunlp | grep mgr
3、web登录
默认没有密码
web登陆:http://10.20.9.189:7000/
十一)查看集群状态
1、查看monitor状态
sudo ceph mon stat
2、查看ceph状态
ceph health (detail),ceph -s,ceph -w等;
状态显示mgr处于active-standby模式
[cephde@controller01 cephcluster]$ sudo ceph -s
cluster:
id: 74082074-0322-460a-b962-436fe36f8e7b
health: HEALTH_OK
services:
mon: 3 daemons, quorum controller03,controller01,controller02
mgr: controller01_mgr(active), standbys: controller03_mgr, controller02_mgr
osd: 0 osds: 0 up, 0 in
data:
pools: 0 pools, 0 pgs
objects: 0 objects, 0B
usage: 0B used, 0B / 0B avail
pgs:
3、可在各节点查看认证信息等
[cephde@controller01 cephcluster]$ sudo ceph auth list
installed auth entries:
client.admin
key: AQBebJdb89NfFhAA2D9dFESIX2GhrT/O6AmXqA==
caps: [mds] allow *
caps: [mgr] allow *
caps: [mon] allow *
caps: [osd] allow *
client.bootstrap-mds
key: AQBfbJdbcfQPDhAA1xdq6WhsiyyG79M6hgEqPQ==
caps: [mon] allow profile bootstrap-mds
client.bootstrap-mgr
key: AQBgbJdbTyX/GRAA7RYzmYL7Xx3NnUFg6s9JcQ==
caps: [mon] allow profile bootstrap-mgr
client.bootstrap-osd
key: AQBhbJdbKAfFGRAACyKbfDP1V0Ub92Pw4aU8qQ==
caps: [mon] allow profile bootstrap-osd
client.bootstrap-rgw
key: AQBibJdbfcXxExAAU3Ujlajuu8Pj2vT+f9rAoQ==
caps: [mon] allow profile bootstrap-rgw
mgr.controller01_mgr
key: AQApcJdbjzjkFBAAOz8BodoKJzI1iMeKKwksfQ==
caps: [mds] allow *
caps: [mon] allow profile mgr
caps: [osd] allow *
mgr.controller02_mgr
key: AQAqcJdbaIG5MxAA5+CM7MfiMC/dlkE6NqIdkw==
caps: [mds] allow *
caps: [mon] allow profile mgr
caps: [osd] allow *
mgr.controller03_mgr
key: AQAscJdbYtGtHhAAhmcV1PgTHQPffEnWV2Umfg==
caps: [mds] allow *
caps: [mon] allow profile mgr
caps: [osd] allow *
十二)创建osd(存储)
1、创建osd
1、添加完磁盘,存储节点查看
osd位于存储节点,可查看存储节点磁盘状况(磁盘直接添加上即可,不用分区格式化),以compute01节点为例
$ lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
fd0 2:0 1 4K 0 disk
sda 8:0 0 80G 0 disk
├─sda1 8:1 0 1G 0 part /boot
├─sda2 8:2 0 19G 0 part
│ ├─cl-root 253:0 0 77G 0 lvm /
│ └─cl-swap 253:1 0 2G 0 lvm [SWAP]
└─sda3 8:3 0 60G 0 part
└─cl-root 253:0 0 77G 0 lvm /
sdb 8:16 0 50G 0 disk
└─sdb1 8:17 0 50G 0 part /opt
sdc 8:32 0 10G 0 disk
sdd 8:48 0 16G 0 disk
sde 8:64 0 16G 0 disk
sr0 11:0 1 1024M 0
2、创建osd
实际创建osd时,可通过管理节点使用ceph-deploy创建;本例中有3个osd节点,每个osd节点可运行3个osd进程(在6800~7300端口范围内,每进程监听1个本地端口)
ceph-deploy osd create compute01 --data /dev/sdc
ceph-deploy osd create compute01 --data /dev/sdd
ceph-deploy osd create compute01 --data /dev/sde
ceph-deploy osd create compute02 --data /dev/sdc
ceph-deploy osd create compute02 --data /dev/sdd
ceph-deploy osd create compute02 --data /dev/sde
创建成功如下图
2、查看osd状态
1、在管理节点操作
查看osd列表
$ ceph-deploy osd list compute01
ceph-deploy osd list compute01的运行结果
在管理节点查看osd状态等
[cephde@controller01 cephcluster]$ sudo ceph osd stat
6 osds: 6 up, 6 in
[cephde@controller01 cephcluster]$ sudo ceph osd tree
ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF
-1 0.08197 root default
-3 0.04099 host compute01
0 hdd 0.00980 osd.0 up 1.00000 1.00000
1 hdd 0.01559 osd.1 up 1.00000 1.00000
2 hdd 0.01559 osd.2 up 1.00000 1.00000
-5 0.04099 host compute02
3 hdd 0.00980 osd.3 up 1.00000 1.00000
4 hdd 0.01559 osd.4 up 1.00000 1.00000
5 hdd 0.01559 osd.5 up 1.00000 1.00000
在管理节点查看容量及使用情况
$ sudo ceph df
GLOBAL:
SIZE AVAIL RAW USED %RAW USED
84.0GiB 78.0GiB 6.02GiB 7.17
POOLS:
NAME ID USED %USED MAX AVAIL OBJECTS
2、在存储节点操作
在osd(存储)节点查看
$ lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
fd0 2:0 1 4K 0 disk
sda 8:0 0 80G 0 disk
├─sda1 8:1 0 1G 0 part /boot
├─sda2 8:2 0 19G 0 part
│ ├─cl-root 253:0 0 77G 0 lvm /
│ └─cl-swap 253:1 0 2G 0 lvm [SWAP]
└─sda3 8:3 0 60G 0 part
└─cl-root 253:0 0 77G 0 lvm /
sdb 8:16 0 50G 0 disk
└─sdb1 8:17 0 50G 0 part /opt
sdc 8:32 0 10G 0 disk
└─ceph--693dac4c--5d8c--4c94--aa6e--8e7360eb3dcc-osd--block--cba9c3bc--f75b--4bc7--93e4--5e262dd891f4 253:2 0 10G 0 lvm
sdd 8:48 0 16G 0 disk
└─ceph--9a7db77c--f52a--4403--a1a4--2287cf024cee-osd--block--83583e83--a824--41c5--9d54--6529b0dca943 253:3 0 16G 0 lvm
sde 8:64 0 16G 0 disk
└─ceph--bdd65160--4a3a--45ca--a416--edc4151717ab-osd--block--c1f6b583--61d4--4659--8d06--bb9d929e82cb 253:4 0 16G 0 lvm
sr0 11:0 1 1024M 0 rom
ceph-osd进程,根据启动顺序,每个osd进程有特定的序号
systemctl status ceph-osd@0
osd进程端口号;
ps aux | grep osd
netstat -tunlp | grep osd
十三)登陆mgr_dashboard
浏览器输入:http://10.20.9.189:7000