ESXI虚拟机故障关机处理记录

告警内容为:

包含主机物理页面 100937959,但该页面已被调度为立即失效。为避免系统不稳定,已强制关闭虚拟机电源。

故障原因为:

主机 CPU / 内存子系统触发了可恢复的机器检查异常(MCE,Machine Check Exception),ESXi 内核检测到某一个物理内存页存在不可纠正的硬件错误,且该错误不会导致整个主机崩溃(PSOD 紫屏)。

ESXi 为了防止故障扩散、避免系统整体不稳定和数据损坏,会立即将这个故障内存页标记为 "立即失效 / 退役"。

恰好你的这台虚拟机正在占用这个故障物理内存页,ESXi 作为防护措施,直接强制关闭了该虚拟机,将故障影响范围隔离在单台 VM,而非整个宿主机。

可以在esxi界面看到故障告警(主机内存状态)

BMC也可以看到内存的紧急告警

处理方案:

更换故障内存(业务紧急,虚拟机可先直接拉起)

相关推荐
x***r15113 小时前
.NET 10 SDK 安装教程(dotnet-sdk-10.0.100-win-x64详细步骤)
java·服务器·前端
鹤落晴春13 小时前
RH124问答5:管理本地用户和组
linux·运维·服务器
女神下凡13 小时前
这是 Cursor(Composer) 的五种核心交互模式
服务器·人工智能·windows·vscode·microsoft
IT WorryFree14 小时前
三套 Zabbix7.4 API 可直接复制 params 模板
运维·服务器·网络
RisunJan14 小时前
Linux命令-pmap(进程内存映射报告工具)
linux·服务器·网络
luj_176815 小时前
FreeDOS vs MS-DOS PC-DOS 对比解析
服务器·c语言·开发语言·经验分享·算法
Full Stack Developme15 小时前
Linux rm-rf 执行后,硬盘空间变化
linux·运维·服务器
沪漂阿龙15 小时前
LangChain 系列之Agent:从固定流程到模型自主决策
服务器·数据库·langchain
生信碱移16 小时前
Vscode 连接 ipynb 选择内核无法自动显示 conda 环境对应的 python
服务器·人工智能·经验分享·vscode·python
Web极客码16 小时前
从生成式AI到智能代理:AI正在进入“第二阶段”
服务器·人工智能·ai