服务器CPU达到100%解决思路

当我们在做服务器巡检或者部署相关服务时,我们经常发现服务器CPU异常高,有时候直接达到了100%,那针对这种情况,我们有哪些解决思路和方案呢。

对此,我分享一下我处理的一些经验之谈,供大家参考学习:

一、追根求源

我们要找到问题的源头,问题的导火索可以从以下几个方面进行排查:

1、代码层面:恶性死循环代码模式,内存泄漏,线程池配置有误,正则判断有误;

2、数据库层面:数据库查询阻塞,频次过高;

3、API接口调用:调用频次过高导致超时,不断累加;

4、恶意病毒攻击:doss恶意攻击,木马病毒攻击。

二、定点处理:

1、使用htop或top查看异常的进程:

按shift+P查看CPU占用最高的进程:

2、定位到占用最高的进程,我们开始排查代码细节,包括代码线程配置以及堆栈的优化处理

3、查看日志(系统日志分析,程序服务运行日志)

系统日志:根据syslog,error等字眼去检索查询;

程序服务日志:根据部署配置的日志位置进行查看,一般为error.log的日志文件

三、优化运行:

当我们排查到问题点,再根据问题点进行优化,优化完成,我们需要积累优化的程序步骤,作为后续优化迭代的一个里程碑,因为丝滑的程序访问是不断优化迭代更新的结果。

针对该问题我们还需部署线上实时监控提醒,包括短信提醒,企业微信提醒,这样更有利于提高我们的工作效率。

相关推荐
SkyWalking中文站20 小时前
认识 Horizon UI · 1/17:SkyWalking 新一代可观测性控制台
运维·前端·监控
雪梨酱QAQ1 天前
Kubeneters HA Cluster部署
运维
江华森1 天前
Spring Cloud 微服务全栈实战:从 Eureka 到 Docker Compose 一文贯通
运维
江华森1 天前
Matplotlib 数据绘图基础入门
运维
江华森1 天前
NumPy 数值计算基础入门
运维
乘云数字DATABUFF5 天前
5分钟部署开源APM Databuff:OpenTelemetry全链路追踪入门实战
运维·后端
荣--7 天前
一键部署不是为了省时间 —— 它是把"买来的 PaaS"变成"自己的平台"的拐点
运维·zabbix·工程化·一键部署·平台化·边界设计
江华森7 天前
动手实战学 Docker — 从零到集群编排完全指南
运维
Avan_菜菜8 天前
FRP 内网穿透完整实战:从 HTTP 映射到 HTTPS 自签代理
运维·nginx·https
SelectDB9 天前
Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台
运维·后端·自动化运维