达梦8-数据守护集群主备故障实验和脑裂处理

实验1:将内网断开,查看主备库状态,并测试数据同步情况

测试环境

##主库信息

内网IP-[MAL_HOST = 192.168.50.100]

外网IP-[MAL_INST_HOST = 192.168.101.11]

主库实例名-[DM01]
##备库信息

内网IP-[MAL_HOST = 192.168.50.110]

外网IP-[MAL_INST_HOST = 192.168.101.22]

备库实例名-[DM02]

主备库状态

在备库配置dm_svc.conf服务名-【DM】

在备库使用服务名登录:

此时直接连接到主库的实例。

测试-断开主库的内网,将主库的内网网卡关闭。网卡名称-[ens36]

查看主库和备库的监视器信息

打开监视器:

/opt/dmdbms/bin/dmmonitor /data/dmdata/DAMENG/dmmonitor.ini

主库

备库

使用"show"命令查看主备库状态

主库:

备库:

使用配置的服务名,在备库连接,创建表,进行数据查询

因为只有内网发生故障,主库的实例正常,使用外网连接实例可以正常操作。

登录备库实例查询,看数据是否同步。

因为内网连接断开,主库的redo日志信息不能同步到备库。所以备库不能查到相应的数据。

实验2:主备集群脑裂

制造脑裂环境

主库故障,备库强制接管故障primary主库(原备库,现主库)。

takeover force GRP1.DM02

注意
执行Takeover Force有可能引发组分裂,而Takeover命令是在确保不会产生组分裂情况下才允许执行。

故障主库恢复正常(原主库,现备库)重新加入集群,此时原主库出现脑裂问题。

数据守护 V4.0 对守护进程控制文件(dmwatcher.ctl)进行了简化,仅用于记录本地数据库的分裂状态和分裂描述信息。守护进程在检测到本地库分裂时,自动创建 dmwatcher.ctl 文件,保存在本地库的 SYSTEM_PATH 路径下,并且文件中记录的状态一定是 Split 分裂状态。如果 dmwatcher 加载到 dmwatcher.ctl 文件,则认为对应的库一定是分裂状态。如果需要对分裂库进行重建,则需要手动将 dmwatcher.ctl 文件删除,否则守护进程仍然会认定本地库为分裂库。

守护进程控制文件仅包含版本号、状态及分裂描述信息这三项内容。

状态字段包含以下两种:

  • 有效(VALID) 正常运行时状态。

  • 分裂(SPLIT) 数据和有效主库的数据不一致时设置。

主备库关闭DmWatcher 、DMserver

注意当前的主库是DM02,备库是DM01

主库DM02-主机dmdb02

备库DM01-主机dmdb01

备库删除当前实例,保留配置文件

cd /data/dmdata/DAMENG
cp *.ini /data
rm -rf DAMENG

备库重新初始化实例

[dmdba@dmdb01 data]$ cd /opt/dmdbms/bin
[dmdba@dmdb01 bin]$ ./dminit PATH=/data/dmdata PAGE_SIZE=32 EXTENT_SIZE=32 LOG_SIZE=256 CHARSET=1 CASE_SENSITIVE=1 SYSDBA_PWD=Dameng123 INSTANCE_NAME=DM01

主库进行物理备份

[dmdba@dmdb02 bin]$ ./dmrman
dmrman V8
RMAN> backup database '/data/dmdata/DAMENG/dm.ini' full to bak_full backupset '/data/dmbak/bak_full';

主库将备份文件和归档文件传输到备库

scp -r /data/dmbak/bak_full/ dmdba@192.168.101.11:/data/dmbak/

备库进行恢复

[dmdba@dmdb01 bin]$ ./dmrman

RMAN> restore database '/data/dmdata/DAMENG/dm.ini' from backupset '/data/dmbak/bak_full';

RMAN> recover database '/data/dmdata/DAMENG/dm.ini' from backupset '/data/dmbak/bak_full';

RMAN> recover database '/data/dmdata/DAMENG/dm.ini' update db_magic;

修改备库状态

备库实例启动到mount状态

[dmdba@dmdb01 bin]$ ./DmServiceDM01 start mount

[dmdba@dmdb01 bin]$ ./disql sysdba/Dameng123

服务器[LOCALHOST:5236]:处于主库配置状态

SQL> sp_set_para_value(1,'ALTER_MODE_STATUS',1);

SQL> sp_set_oguid(45335);

SQL> alter database standby;

SQL> sp_set_para_value(1,'ALTER_MODE_STATUS',0);

主备库依次启动DmServer、DmWatcher

[dmdba@dmdb01 bin]$ pwd
/opt/dmdbms/bin

主库
./DmServiceDM02 start
备库
 ./DmServiceDM01 restart
主库
./DmWatcherServiceDM02 start
备库
./DmWatcherServiceDM01 start

登录非确认监视器,查看集群主备库状态

当前的主备库已恢复正常。

若想将主备切换回去时,只需要启动非确认监视器执行切换命令-switchover命令。

##切换指定组的指定库为Primary库

switchover [group_name[.]] [db_name]
##使用指定组的指定库接管故障Primary库

takeover [group_name[.]] [db_name]
##使用指定组的指定库强制接管故障Primary库

takeover force [group_name[.]] [db_name]

相关推荐
CoderIsArt1 小时前
Redis的三种模式:主从模式,哨兵与集群模式
数据库·redis·缓存
师太,答应老衲吧3 小时前
SQL实战训练之,力扣:2020. 无流量的帐户数(递归)
数据库·sql·leetcode
Channing Lewis4 小时前
salesforce case可以新建一个roll up 字段,统计出这个case下的email数量吗
数据库·salesforce
毕业设计制作和分享5 小时前
ssm《数据库系统原理》课程平台的设计与实现+vue
前端·数据库·vue.js·oracle·mybatis
ketil275 小时前
Redis - String 字符串
数据库·redis·缓存
Hsu_kk6 小时前
MySQL 批量删除海量数据的几种方法
数据库·mysql
编程学无止境6 小时前
第02章 MySQL环境搭建
数据库·mysql
knight-n6 小时前
MYSQL库的操作
数据库·mysql
包饭厅咸鱼7 小时前
QML----复制指定下标的ListModel数据
开发语言·数据库
生命几十年3万天8 小时前
redis时间优化
数据库·redis·缓存