大数据-之LibrA数据库系统告警处理(ALM-12055 证书文件即将过期)

告警解释

系统每天二十三点检查一次当前系统中的证书文件,如果当前时间距离过期时间不足告警阈值天数,则证书文件即将过期,产生该告警。告警阈值天数的配置请参考《管理员指南》的"配置证书即将过期告警阈值"章节。

当重新导入一个正常证书,并且状态不为即将过期,该告警恢复。

告警属性
告警ID 告警级别 可自动清除
12055 一般
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称。
RoleName 产生告警的角色名称。
HostName 产生告警的主机名。
Trigger Condition 系统当前指标取值满足自定义的告警设置条件。
对系统的影响

提示用户证书文件即将过期,如果证书文件过期,则会导致部分功能受限,无法正常使用。

可能原因

系统证书文件(CA证书、HA根证书或者HA用户证书)剩余有效期小于证书的告警阈值。

处理步骤

查看告警原因

  1. 打开FusionInsight Manager页面,在实时告警列表中,单击此告警所在行。

    在"告警详情"区域查看"附加信息",获取告警附加信息。

    • 告警附加信息中显示"CA Certificate",使用PuTTY工具以omm 用户登录主OMS管理节点,执行[步骤 2](#步骤 2)。
    • 告警附加信息中显示"HA root Certificate",查看"定位信息"获取告警所在节点主机名,使用PuTTY工具以omm 用户登录该主机,执行[步骤 3](#步骤 3)。
    • 告警附加信息中显示"HA server Certificate", 查看"定位信息"获取告警所在节点主机名,使用PuTTY工具以omm 用户登录该主机,执行[步骤 4](#步骤 4)

检查系统中合法证书文件的有效期。

  1. 查看当前CA证书剩余有效期是否小于证书的告警阈值。

    执行命令bash ${CONTROLLER_HOME}/security/cert/conf/querycertvalidity.sh可以查看CA根证书的生效时间与失效时间。

    • 是,执行[步骤 5](#步骤 5)。
    • 否,执行[步骤 7](#步骤 7)。
  2. 查看当前HA根证书剩余有效期是否小于证书的告警阈值。

    执行命令openssl x509 -noout -text -in ${CONTROLLER_HOME}/security/certHA/root-ca.crt可以查看HA根证书的生效时间与失效时间。

    • 是,执行[步骤 6](#步骤 6)。
    • 否,执行[步骤 7](#步骤 7)。
  3. 查看当前HA用户证书剩余有效期是否小于证书的告警阈值。

    执行命令openssl x509 -noout -text -in ${CONTROLLER_HOME}/security/certHA/server.crt可以查看HA用户证书的生效时间与失效时间。

    • 是,执行[步骤 6](#步骤 6)。

    • 否,执行[步骤 7](#步骤 7)。

      CA或者HA证书的"生效时间"和"失效时间" 示例:

      复制代码

导入证书文件。

  1. 导入新的CA证书文件。

    申请或生成新的CA证书文件并导入,具体操作请参考《管理员指南》的"更换CA证书"章节。手动清除该告警信息,查看系统在定时检查时是否会再次产生此告警。

    • 是,执行[步骤 7](#步骤 7)。
    • 否,处理完毕。
  2. 导入新的HA证书文件。

    申请或生成新的HA证书文件并导入,具体操作请参考《管理员指南》的"更换HA证书"章节。手动清除该告警信息,查看系统在定时检查时是否会再次产生此告警。

    • 是,执行[步骤 7](#步骤 7)。
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"
  2. 在"服务"下拉框中勾选"Controller"、"OmmServer"、"OmmCore"和"Tomcat",单击"确定"。
  3. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后10分钟,单击"下载"。
相关推荐
武子康2 小时前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
NineData11 小时前
NineData 迁移评估功能正式上线
数据库·dba
NineData16 小时前
数据库迁移总踩坑?用 NineData 迁移评估,提前识别所有兼容性风险
数据库·程序员·云计算
赵渝强老师18 小时前
【赵渝强老师】PostgreSQL中表的碎片
数据库·postgresql
字节跳动数据平台1 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
全栈老石1 天前
拆解低代码引擎核心:元数据驱动的"万能表"架构
数据库·低代码
得物技术1 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
小时前端1 天前
HTTPS 页面加载 HTTP 脚本被拦?同源代理来救场
前端·https
武子康1 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
倔强的石头_2 天前
kingbase备份与恢复实战(二)—— sys_dump库级逻辑备份与恢复(Windows详细步骤)
数据库