ESXI虚拟机故障关机处理记录

告警内容为:

包含主机物理页面 100937959,但该页面已被调度为立即失效。为避免系统不稳定,已强制关闭虚拟机电源。

故障原因为:

主机 CPU / 内存子系统触发了可恢复的机器检查异常(MCE,Machine Check Exception),ESXi 内核检测到某一个物理内存页存在不可纠正的硬件错误,且该错误不会导致整个主机崩溃(PSOD 紫屏)。

ESXi 为了防止故障扩散、避免系统整体不稳定和数据损坏,会立即将这个故障内存页标记为 "立即失效 / 退役"。

恰好你的这台虚拟机正在占用这个故障物理内存页,ESXi 作为防护措施,直接强制关闭了该虚拟机,将故障影响范围隔离在单台 VM,而非整个宿主机。

可以在esxi界面看到故障告警(主机内存状态)

BMC也可以看到内存的紧急告警

处理方案:

更换故障内存(业务紧急,虚拟机可先直接拉起)

相关推荐
PatrickYao042229 分钟前
Hydro OJ部署完全指南!
服务器·oj·hydro·在线评测
小政同学42 分钟前
【NFS故障】共享的文件无法执行
linux·运维·服务器
不会写DN1 小时前
受保护的海报图片读取方案 - 在不公开静态资源目录下如何获取静态资源
服务器
AI木马人1 小时前
3.【Prompt工程实战】如何设计一个可复用的Prompt系统?(避免每次手写提示词)
linux·服务器·人工智能·深度学习·prompt
挽安学长2 小时前
保姆级教程,通过GACCode使用Claude Code Desktop!
运维·服务器
firstacui3 小时前
MGRE实验
运维·服务器·网络
大卡片4 小时前
IO模型与并发服务器设计
运维·服务器·网络
莎士比亚的文学花园4 小时前
Linux驱动开发(1)——系统移植
linux·运维·服务器
鲁Q同志4 小时前
VMware虚拟机安装Ubuntu22
ubuntu·vmware
PH = 74 小时前
OverlayFS联合文件系统使用示例
java·linux·服务器