阿里云平台健康检查巡检清单-运维篇阿里云平台健康检查综合巡检清单1. 管理节点检查 * 节点运行状态: * 检查管理节点(如部署了管控组件的ECS实例)是否处于 Running 状态。 * 通过阿里云控制台、OpenAPI 或 CLI 确认状态。 * 检查系统负载(CPU、内存)是否在合理范围,无持续高负载。 * 服务运行状态: * 检查关键管理服务(如管控 Agent、监控 Agent、日志服务 Agent、安全服务 Agent、调度服务等)是否正常运行 (systemctl status, ps aux)。 * 检查服务日志 (jou