达梦8-数据守护集群主备故障实验和脑裂处理

实验1:将内网断开,查看主备库状态,并测试数据同步情况

测试环境

##主库信息

内网IP-MAL_HOST = 192.168.50.100

外网IP-MAL_INST_HOST = 192.168.101.11

主库实例名-DM01
##备库信息

内网IP-MAL_HOST = 192.168.50.110

外网IP-MAL_INST_HOST = 192.168.101.22

备库实例名-DM02

主备库状态

在备库配置dm_svc.conf服务名-【DM】

在备库使用服务名登录:

此时直接连接到主库的实例。

测试-断开主库的内网,将主库的内网网卡关闭。网卡名称-ens36

查看主库和备库的监视器信息

打开监视器:

/opt/dmdbms/bin/dmmonitor /data/dmdata/DAMENG/dmmonitor.ini

主库

备库

使用"show"命令查看主备库状态

主库:

备库:

使用配置的服务名,在备库连接,创建表,进行数据查询

因为只有内网发生故障,主库的实例正常,使用外网连接实例可以正常操作。

登录备库实例查询,看数据是否同步。

因为内网连接断开,主库的redo日志信息不能同步到备库。所以备库不能查到相应的数据。

实验2:主备集群脑裂

制造脑裂环境

主库故障,备库强制接管故障primary主库(原备库,现主库)。

takeover force GRP1.DM02

注意
执行Takeover Force有可能引发组分裂,而Takeover命令是在确保不会产生组分裂情况下才允许执行。

故障主库恢复正常(原主库,现备库)重新加入集群,此时原主库出现脑裂问题。

数据守护 V4.0 对守护进程控制文件(dmwatcher.ctl)进行了简化,仅用于记录本地数据库的分裂状态和分裂描述信息。守护进程在检测到本地库分裂时,自动创建 dmwatcher.ctl 文件,保存在本地库的 SYSTEM_PATH 路径下,并且文件中记录的状态一定是 Split 分裂状态。如果 dmwatcher 加载到 dmwatcher.ctl 文件,则认为对应的库一定是分裂状态。如果需要对分裂库进行重建,则需要手动将 dmwatcher.ctl 文件删除,否则守护进程仍然会认定本地库为分裂库。

守护进程控制文件仅包含版本号、状态及分裂描述信息这三项内容。

状态字段包含以下两种:

  • 有效(VALID) 正常运行时状态。

  • 分裂(SPLIT) 数据和有效主库的数据不一致时设置。

主备库关闭DmWatcher 、DMserver

注意当前的主库是DM02,备库是DM01

主库DM02-主机dmdb02

备库DM01-主机dmdb01

备库删除当前实例,保留配置文件

复制代码
cd /data/dmdata/DAMENG
cp *.ini /data
rm -rf DAMENG

备库重新初始化实例

复制代码
[dmdba@dmdb01 data]$ cd /opt/dmdbms/bin
[dmdba@dmdb01 bin]$ ./dminit PATH=/data/dmdata PAGE_SIZE=32 EXTENT_SIZE=32 LOG_SIZE=256 CHARSET=1 CASE_SENSITIVE=1 SYSDBA_PWD=Dameng123 INSTANCE_NAME=DM01

主库进行物理备份

复制代码
[dmdba@dmdb02 bin]$ ./dmrman
dmrman V8
RMAN> backup database '/data/dmdata/DAMENG/dm.ini' full to bak_full backupset '/data/dmbak/bak_full';

主库将备份文件和归档文件传输到备库

复制代码
scp -r /data/dmbak/bak_full/ dmdba@192.168.101.11:/data/dmbak/

备库进行恢复

复制代码
[dmdba@dmdb01 bin]$ ./dmrman

RMAN> restore database '/data/dmdata/DAMENG/dm.ini' from backupset '/data/dmbak/bak_full';

RMAN> recover database '/data/dmdata/DAMENG/dm.ini' from backupset '/data/dmbak/bak_full';

RMAN> recover database '/data/dmdata/DAMENG/dm.ini' update db_magic;

修改备库状态

备库实例启动到mount状态

复制代码
[dmdba@dmdb01 bin]$ ./DmServiceDM01 start mount

[dmdba@dmdb01 bin]$ ./disql sysdba/Dameng123

服务器[LOCALHOST:5236]:处于主库配置状态

SQL> sp_set_para_value(1,'ALTER_MODE_STATUS',1);

SQL> sp_set_oguid(45335);

SQL> alter database standby;

SQL> sp_set_para_value(1,'ALTER_MODE_STATUS',0);

主备库依次启动DmServer、DmWatcher

复制代码
[dmdba@dmdb01 bin]$ pwd
/opt/dmdbms/bin

主库
./DmServiceDM02 start
备库
 ./DmServiceDM01 restart
主库
./DmWatcherServiceDM02 start
备库
./DmWatcherServiceDM01 start

登录非确认监视器,查看集群主备库状态

当前的主备库已恢复正常。

若想将主备切换回去时,只需要启动非确认监视器执行切换命令-switchover命令。

##切换指定组的指定库为Primary库

switchover group_name\[.] db_name
##使用指定组的指定库接管故障Primary库

takeover group_name\[.] db_name
##使用指定组的指定库强制接管故障Primary库

takeover force group_name\[.] db_name

相关推荐
Databend11 小时前
Agent 轨迹分析与归因的数据工程实践
大数据·数据库·agent
这个DBA有点耶11 小时前
SQL改写进阶:标量子查询的“隐形代价”与消除实战
数据库·mysql·架构
smallyoung12 小时前
数据库乐观锁深度解析:MySQL、PostgreSQL 实战 + Spring Boot 集成指南
数据库·mysql·postgresql
parade岁月12 小时前
MySQL JOIN解析:朴实无华但食之有味
数据库·后端
用户31693538118313 小时前
MySQL服务无法启动问题解决全记录
数据库
vivo互联网技术16 小时前
从 10 分钟到 1 秒:ES 深度分页任意跳页的三轮优化实战
服务器·数据库·redis·elasticsearch·深度分页
倔强的石头_1 天前
《Kingbase护城河》——猎捕慢查询:执行计划的微观解析与索引调优实战
数据库
SelectDB1 天前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
jiayou643 天前
KingbaseES 表级与列级加密完全指南
数据库·后端
GBASE3 天前
G术时刻 |GBase 8s数据库事务并发控制之封锁技术介绍(下)
数据库