【银河麒麟高级服务器操作系统】实际案例分析,xfsaild占用过高

了解银河麒麟操作系统更多全新产品,请点击访问麒麟软件产品专区:https://product.kylinos.cn

服务器环境及配置

|----------|-------------------------------------------------------------------|
| 物理机/虚拟机 | 物理机 |
| 处理器: | Intel(R) Xeon(R) Silver 4110 CPU @ 2.10GHz |
| 内存: | 65536 MiB (64 GiB) |
| 主板型号: | HPE ProLiant DL380 Gen10 Not Specified |
| 整机类型/架构: | x86 |
| BIOS版本: | HPE U30 |
| 系统硬盘: | 2 disks, totaling 2515 GiB (2.46 TiB) |
| 网卡: | BCM5719:tg3 |
| 操作系统版本: | 银河麒麟高级服务器操作系统 Kylin-Server-10-SP2-Release-Build09-20210524-x86_64 |
| 内核版本 | 4.19.90-24.4.v2101.ky10.x86_64 |

现象分析

查看 sosreport 日志中的进程信息,可以看到,xfsaild/sda4为不可中断进程,并且cpu占用高的为abrtd 进程。

由于现场有两台机器存在这个问题,另外一台机器复现频率较高,我们从另外一台入手。

现场 iotop 结果如下,可见占用最高的为内核线程 xfsaild/sda4

两台 ps 信息都是 xfsaild/sda4进入了D状态,xfsaild 是xfs文件系统的一个辅助进程,用于异步执行一些I/O操作,如延迟分配,元数据同步等,此处可以看到是对 sda4 进行操作。并且占用最高 cpu 进程为 abrtd,Abrtd服务在sp2没有被默认安装,在sp2上,用于生成进程的核心转储文件(core dump)的组件为systemd-coredump。abrtd的频繁报告,可能会加大磁盘的负载。

sda4 为系统的根分区,用的调度算法为none,据现场说都是机械盘,跑的是nginx 业务,如果是机械盘建议调度算法为mq-deadline而不是设置为none。

并且注意到rasdaemon和audit服务有缺陷,具体可以参考官网https://www.kylinos.cn/support/update/6.html、https://www.kylinos.cn/support/update/12.html

初步建议

1、修改sda磁盘调度算法为mq-deadline。

|------------------------------------------------------------|
| Shell echo "mq-deadline" > /sys/block/sda/queue/scheduler |

2、如对abrtd服务没特殊需求,可关闭abrtd服务

|------------------------------------------------------------------------------|
| Shell systemctl disable abrtd --now # 注意,停止后确保abrt进程全部停掉 ps -ef | grep abrt |

3、升级audit到源里面最新版本,升级后重启auditd.service生效

|----------------------------------------|
| Shell systemctl restart auditd.service |

4、升级rasdaemon到源里面最新版本,升级后重启rasdaemon.service生效

|-------------------------------------------|
| Shell systemctl restart rasdaemon.service |

相关推荐
我科绝伦(Huanhuan Zhou)7 分钟前
Oracle控制文件、SCN与检查点机制深度解析及数据库初始化原理
运维·数据库·oracle
杨云龙UP30 分钟前
从0到可落地:Oracle RMAN异地NFS备份标准脚本(多实例通用)
linux·运维·数据库·oracle
*星星之火*35 分钟前
【大白话 AI 答疑】第6篇 大模型指令微调:instruction/input/output核心解析及案例
服务器·前端·人工智能
黑客思维者35 分钟前
嵌入式系统DevSecOps深度设计:构建固件级漏洞免疫体系的自动化管道
运维·自动化·devsecops·嵌入式系统
古城小栈36 分钟前
吃透Cron表达式
linux·服务器·数据库
猫猫的小茶馆1 小时前
【ARM】BootLoader(Uboot)介绍
linux·汇编·arm开发·单片机·嵌入式硬件·mcu·架构
Yeliang Wu1 小时前
LLaMA-Factory 模型评估理论与实战:基于 Ubuntu 22.04 的系统化指南
linux·ubuntu·llama·评估·llamafactory
生信大表哥1 小时前
单细胞测序分析(十一)轨迹分析
linux·rstudio·数信院生信服务器·生信云服务器
躺着听Jay1 小时前
【1267 - Illegal mix of collations 】mysql报错解决记录
java·linux·前端
不秃头的帅哥1 小时前
程序地址空间(基于c++和linxu的一些个人笔记
linux·开发语言·c++·操作系统·内存空间