OS的load average很高

参考文档:

(KB432115) Oracle Linux: Multiple floppy_read_block_0 in D-State causes High Load Average

(KB424510) Oracle Linux: Continuously Increasing High Load Average on the Server.

(KB112591) Top Shows High Load Average

(KB398652) Abnormally High Load Average Numbers Observed On Exadata Server

在很多年前,看到过一个rac,节点1上的load average 在250左右,但是节点1的cpu使用率很低,也没有IO相关的负载。节点2的load average在4左右(当时百思不得其解)

今天看到一个exaddata的计算节点,是x11 。其中一个节点上load average已经快42亿了,另一个节点还不到5 。

在load average 42亿的节点上,看到%CPU使用率很低。部分信息如下

复制代码
top - 10:46:43 up 208 days, 47 min,  0 users,  load average: 4294967301.72, 4294967301.29, 4294967300.87
Tasks: 5139 total,   8 running, 5131 sleeping,   0 stopped,   0 zombie
%Cpu(s): 15.9 us, 10.0 sy,  0.1 ni, 73.1 id,  0.0 wa,  0.3 hi,  0.6 si,  0.0 st
MiB Mem : 778927.1 total, 113914.6 free, 504902.9 used, 160109.5 buff/cache
MiB Swap:  16384.0 total,  16375.2 free,      8.8 used. 250068.2 avail Mem 

通过以下命令,查看了下,确实有个进程状态的D.

复制代码
ps -aux | awk '$8 == "D" {print $0}'

这个进程状态为D的进程为exawatcher.

这个问题,到此得到了解释。

关于(KB398652) Abnormally High Load Average Numbers Observed On Exadata Server这个文档。里面的load average 和今天发现的是一样的(至少前面的42亿多,是一样的)。不过这个文档中提到没有D进程,而且这个文档说的是exadata storage,也就是cell节点。不过今天的是计算节点。

END

相关推荐
a95114164217 小时前
CSS如何实现元素隐藏不占位_使用display-none完全移除
jvm·数据库·python
SelectDB技术团队18 小时前
SelectDB Enterprise 4.0.5:强化安全与治理,构建企业级实时分析与 AI 数据底座
数据库·人工智能·apache doris
一 乐18 小时前
医院挂号|基于springboot + vue医院挂号管理系统(源码+数据库+文档)
java·数据库·vue.js·spring boot·论文·毕设·医院挂号管理系统
ego.iblacat19 小时前
Redis 核心概念与部署
数据库·redis·缓存
m0_4939345319 小时前
如何监控AWR数据收集Job_DBA_SCHEDULER_JOBS中的BSLN_MAINTAIN_STATS
jvm·数据库·python
万岳科技系统开发19 小时前
商城系统搭建自建平台与入驻第三方平台对比分析
数据库·小程序·架构
不剪发的Tony老师19 小时前
QoreDB:一款跨平台、现代化的通用数据库客户端
数据库
五阿哥永琪19 小时前
MySQL 中 VARCHAR、TEXT 与 JSON 类型:区别、场景与选型指南
数据库·mysql·json
a95114164219 小时前
Go语言如何操作OSS_Go语言阿里云OSS上传教程【完整】
jvm·数据库·python
2401_8971905520 小时前
MySQL中如何利用LIMIT配合函数分页_MySQL分页查询优化
jvm·数据库·python