服务器CPU达到100%解决思路

当我们在做服务器巡检或者部署相关服务时,我们经常发现服务器CPU异常高,有时候直接达到了100%,那针对这种情况,我们有哪些解决思路和方案呢。

对此,我分享一下我处理的一些经验之谈,供大家参考学习:

一、追根求源

我们要找到问题的源头,问题的导火索可以从以下几个方面进行排查:

1、代码层面:恶性死循环代码模式,内存泄漏,线程池配置有误,正则判断有误;

2、数据库层面:数据库查询阻塞,频次过高;

3、API接口调用:调用频次过高导致超时,不断累加;

4、恶意病毒攻击:doss恶意攻击,木马病毒攻击。

二、定点处理:

1、使用htop或top查看异常的进程:

按shift+P查看CPU占用最高的进程:

2、定位到占用最高的进程,我们开始排查代码细节,包括代码线程配置以及堆栈的优化处理

3、查看日志(系统日志分析,程序服务运行日志)

系统日志:根据syslog,error等字眼去检索查询;

程序服务日志:根据部署配置的日志位置进行查看,一般为error.log的日志文件

三、优化运行:

当我们排查到问题点,再根据问题点进行优化,优化完成,我们需要积累优化的程序步骤,作为后续优化迭代的一个里程碑,因为丝滑的程序访问是不断优化迭代更新的结果。

针对该问题我们还需部署线上实时监控提醒,包括短信提醒,企业微信提醒,这样更有利于提高我们的工作效率。

相关推荐
苏宸啊7 小时前
Linux指令篇(一)
linux·运维·服务器
睡不醒的猪儿8 小时前
nginx常见的优化配置
运维·nginx
我要升天!8 小时前
Linux中《网络基础》
linux·运维·网络
国强_dev8 小时前
在数据库开发和运维中的“错误信息误导(Red Herring)”
运维·adb·数据库开发
安科瑞刘鸿鹏179 小时前
工业自动化系统中抗晃电保护的协同控制研究
运维·网络·嵌入式硬件·物联网
ZStack开发者社区9 小时前
ZStack Cloud 5.5.0正式发布
运维·服务器·网络
草莓熊Lotso9 小时前
脉脉独家【AI创作者xAMA】|当豆包手机遭遇“全网封杀”:AI学会操作手机,我们的饭碗还保得住吗?
运维·开发语言·人工智能·智能手机·脉脉
三不原则9 小时前
银行 AIOps 实践拆解:金融级故障自愈体系如何搭建
大数据·运维
源代码•宸10 小时前
Golang语法进阶(并发概述、Goroutine、Channel)
服务器·开发语言·后端·算法·golang·channel·goroutine
晴天¥10 小时前
VMware+Oracle linux LVM/非LVM磁盘扩容
linux·运维·服务器