【故障公告】数据库服务器今年第六次 CPU 100% 故障

自9月第五次数据库服务器 CPU 100% 故障之后,今天下午又出现数据库服务器 CPU 100% 故障,是今年的第六次。

自从园子2013年搬上阿里云,几乎每年都会遇到数据库服务器 CPU 100% 问题,但今年创造了新记录,一年还未结束,却已遭遇六次,最困难的一年,连故障也过来凑热闹。

今天的故障发生于 14:28~14:50 期间,我们在 14:30 左右发现故障,立即采用故障处理三板斧之第一斧------重启RDS实例,重启后恢复正常,但很快又出现 CPU 100%,紧接着采用故障处理三板斧之第二斧------主备切换,切换完成后恢复正常。

我们租用的阿里云 RDS 规格是 SQL Server 2016 标准版-高可用系列-16核32G,这个 CPU 100% 问题很奇怪,可能是因为一只老鼠坏了一锅汤------参数嗅探问题造成 SQL Server 缓存了性能极差的执行计划,但我们不能确认就是这个原因,可能要等以后自己用阿里云服务器部署 SQL Server 才能验证。

这次故障给大家带来了麻烦,请大家谅解。

相关推荐
博客园团队1 个月前
【故障公告】2w左右QPS攻击请求造成博客站点502
故障公告
博客园团队2 个月前
【故障公告】数据库服务器 CPU 100% 造成全站故障
故障公告
博客园团队4 个月前
【故障公告】博客站点遭遇大规模疑似 CC 攻击
故障公告
博客园团队1 年前
【故障公告】疑似未知知名搜索引擎蜘蛛来袭,一台负载均衡带宽跑满
故障公告
博客园团队1 年前
【故障公告】数据库服务器今年第七次 CPU 100% 故障
故障公告
博客园团队1 年前
【故障公告】遭遇用心良苦的疯狂攻击:DDoS + CC攻击
故障公告