GaussDB一次小故障修复

背景

从外地出差回到公司总部,发现测试环境的GaussDB坏掉了,具体的故障现象就是etcd节点down状态。

具体故障如下图所示

通过查询华为GaussDB的手册得知,可以用

gs_replace -t config -h nodename修复,因是公司测试环境,就大胆尝试,然后居然报错了。

正常应该是下面这样。

由于自己对GaussDB经验较少,然后就不知道怎么办了,求助了同事,同事也说不知道怎么回事,然后求助了华为盘古模型,问的较少,问了比较有经验的同事,找到了解决办法。

上述报错是因为华为的agent 执行失败了,导致云数据库GaussDB管理平台(tpops)不能连接到数据库节点。修复办法就是根据提示修复agent 就可以了。

就是下图中的 把正常节点启动agent的定时任务复制的不正常的节点,就可以完成修复任务。

修复完成之后,就可以看到数据库集群是正常状态了,如下图所示。

数据检查也是正常的。

但是云管理平台还是不正常的状态。

解决上述问题的方法就是,找到之前的任务,释放锁,然后重试任务就好了。

释放锁的操作。

此处之做问题记录,不做具体原因分析,以后遇到同类问题能快速处理即可。

相关推荐
云和恩墨4 天前
技术时刻丨GaussDB使用DBLINK连接到Oracle
数据库·oracle·gaussdb
百炼成神 LV@菜哥5 天前
记GaussDB(for PostgreSQL)入门SQL操作
数据库·postgresql·gaussdb
DarkAthena5 天前
【GaussDB】执行索引跳扫时如果遇到该索引正在执行autovacuum,可能会导致数据查询不到
数据库·gaussdb
人工智能知识库6 天前
2026年HCCDP-GaussDB工作级开发者题库(详细解析)
数据库·华为·gaussdb·题库·hccdp-gaussdb·工作级开发者认证
DarkAthena6 天前
【GaussDB】解析GaussDB热补丁机制
数据库·gaussdb
Gauss松鼠会6 天前
【GaussDB 】GaussDB 性能排查与锁等待分析常用 SQL 全面解析(TOP SQL / 等锁 / 长事务 / LwLock / SubPlan)
数据库·sql·gaussdb
yumgpkpm8 天前
华为 GaussDB 商业版(本地部署)部署方案及相关步骤
hive·hadoop·redis·elasticsearch·华为·kafka·gaussdb
DarkAthena10 天前
【GaussDB】数据静止状态下同一个SQL或同一个存储过程执行第6次报错的问题排查
数据库·sql·gaussdb
人工智能知识库11 天前
华为HCCDP-GaussDB工作级开发者题库(带详细解析)
华为·gaussdb·hccdp-gaussdb·工作级开发者认证
robinson198812 天前
测试崖山-DM8-GaussDB-OpenTeleDB数据库在长事务下表和索引是否膨胀
达梦·表膨胀·gaussdb·openteledb·崖山