openGauss 数据库报错"failed: To0 many open files"
报错:
最近在测试搭建测试高斯数据库的时候,发现当应用程序和数据库对接完成之后,经常是运行一段时间就应用就挂了,去查看了应用程序日志,发现了如下报错:

failed: To0 many open files,这个报错一般是应用程序或者是用户的文件描述符 被限制导致的,在Linux系统中,每个用户和程序的 文件描述符,都是默认被限制到了 1024的,
排查流程
看到上述报错可以确定,数据库无法连接的原因就是因为文件描述符 被限制导致的,所以我查看当前用户、omm(运行数据库用户),以及limit.conf配置。



看带上面三个配置可以发现,我们关于文件最大描述附最大值是配置到100000的,理论上是不会被耗尽的。接下来查看一下,当前已打开的文件数量

powershell
# 查看特定 PostgreSQL 进程打开的文件描述符数量(替换 <PID> 为实际进程 ID)
ls -l /proc/<PID>/fd | wc -l
# 查看该进程的具体限制配置
cat /proc/<PID>/limits | grep "Max open files"
通过cat /proc/<PID>/limits查看发现这里显示的文件描述最大值还是1024。
问题定位
后来通过在网上查询之后才发现,因为如果进程是通过systemd的方式去管理的话。进程启动的时候是不会读取max-limits.conf的配置文件,还是会使用默认的1024,这个时候就需要我们去修改systemd 的启动脚本来指定 Max open files 。

在启动脚本的【Service】中添加
powershell
LimitNOFILE=65536
LimitNPROC=65536
修改完之后记得reload一下systemd配置在重启数据库
powershell
systemctl daemon-reload
systemctl restart opengauss.service
解决验证
重启之后,在查看文件描述符限制,可以看到就变成了我们修改的数值了,再重启应用程序后正常。
