ESXI虚拟机故障关机处理记录

告警内容为:

包含主机物理页面 100937959,但该页面已被调度为立即失效。为避免系统不稳定,已强制关闭虚拟机电源。

故障原因为:

主机 CPU / 内存子系统触发了可恢复的机器检查异常(MCE,Machine Check Exception),ESXi 内核检测到某一个物理内存页存在不可纠正的硬件错误,且该错误不会导致整个主机崩溃(PSOD 紫屏)。

ESXi 为了防止故障扩散、避免系统整体不稳定和数据损坏,会立即将这个故障内存页标记为 "立即失效 / 退役"。

恰好你的这台虚拟机正在占用这个故障物理内存页,ESXi 作为防护措施,直接强制关闭了该虚拟机,将故障影响范围隔离在单台 VM,而非整个宿主机。

可以在esxi界面看到故障告警(主机内存状态)

BMC也可以看到内存的紧急告警

处理方案:

更换故障内存(业务紧急,虚拟机可先直接拉起)

相关推荐
海参崴-9 分钟前
Linux进程管理完全指南
linux·运维·服务器
CQU_JIAKE13 分钟前
4.4【A】
运维·服务器
星河耀银海39 分钟前
JAVA IO流:从基础原理到实战应用
java·服务器·开发语言
gwjcloud3 小时前
Frp内网穿透
linux·运维·服务器
bIo7lyA8v3 小时前
如何用SSH访问远程服务器上的内网服务(如:MySQL、Redis、Kafka)?
服务器·mysql·ssh
小邓睡不饱耶4 小时前
花店花品信息管理系统开发实战:Python实现简易门店管理系统
服务器·python·microsoft
white-persist4 小时前
【vulhub weblogic CVE-2017-10271漏洞复现】vulhub weblogic CVE-2017-10271漏洞复现详细解析
java·运维·服务器·网络·数据库·算法·安全
TON_G-T5 小时前
useEffect为什么会触发死循环
java·服务器·前端
tHeya06II5 小时前
涵盖 Cursor、Claude Code、Skills
java·服务器
maosheng11465 小时前
Linux的第二次作业
linux·运维·服务器