GaussDB生产扩容引起的PANIC问题处理案例

1 环境信息

CPU:8C

内存:64G

GaussDB版本:24.7.32

解决方案部署形态:HCS

部署形态:1主1从1日志

扩容原因:当前的配置满足不了max_connections为2000值,即当前的业务最大连接数超过2000个而按照8C64G的配置最多满足600的连数据数,经沟通扩容到32C128G。

2 问题现象

服务器扩完容之后,GaussDB启动失败,3个节点状态为down,情况如下:

查看dn日志:

PANIC: proc_init_process numa_run_node_mask fail

3 分析过程

查看ffic日志:

cd $GAUSSLOG/ffic_log

vim gaussdb-2025-08-29-232343.log

使用命令查看:gs_cgroup -P

GaussDB只绑了0-7核,还有8~31核没有绑上。

4 处理方法

使用gs_cgroup -u -T Gaussdb -f命令绑上0-31核。

注:0-31:代表CPU的核数

最后执行gs_ssh命令将所有节点批量修改完成:

如下:

复制代码
gs_ssh -c "gs_cgroup -u -T Gaussdb -f 0-31"

最后重启GaussDB服务:

复制代码
cm_ctl start