VMware虚拟化平台巡检:详细规范与实操技巧

1.1 检测多个主机之间是否有相同的软件版本

|-----------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检测多个ESXi主机间是否有不同的软件版本 | Ø通过图形化方法: 为了获得ESXi主机的版本信息,使用VS Client,点击给定ESXi主机的配置标签。 为了获得VC的版本信息,通过使用VS Client,在主菜单上选择帮助-〉关于虚拟化架构选项 ESXi 5.0.0 1311175 Ø命令行方法: 以root权限登陆ESXi 主机,在命令行提示符下输入"vmware --v" | þ正常 ¨异常 |

1.2 检查网络和存储配置信息是否一致

|-----------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 多个主机之间是否有不同的网卡数量,虚拟交换机数量,不同类型的端口组,网卡速度/全双工,网卡的制造商是否相同,虚拟交换机和端口组命名是否一致,物理网卡在主机上的摆放顺序是否相同 | Ø图形化方法: 在 VS Client里面, 导航到 Configuration -> Networking and Network Adapters 检测: Ø虚拟交换机数量 Ø虚拟交换机命名 Ø物理网卡数量 Ø物理网卡的速度/全双工 Ø端口组类型 Ø是否有冗余 Ø命令行方法: 在命令行提示符下键入 "esxcfg --vswitch --l" 列出多个虚拟交换机和端口组信息 在命令行提示符下键入 "esxcfg-nics --l" 列出多个物理网卡,网卡的速度,制造商,连接状态 | þ正常 ¨异常 |

1.3 检查服务器配置信息是否相同,是否有不同的CPU类型

|-----------------------------|-----------------------------------------------------------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 多个主机之间是否有不同的cpu,超线程配置,处理器速度 | Ø图形化方法: 在VS Client里面, 导航到每个主机的 Configuration -> Processors 检测: ØCpu型号 Ø处理器速度 Ø处理器数量 Ø每个物理处理器上是否有多核核数是否相同 Ø超线程是否开启 Ø逻辑cpu数量 | þ正常 ¨异常 |

1.4 是否配置NTP时钟同步服务

|---------------------------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检测NTP 进程是否在运行, NTP 相关的配置信息, NTP外出 端口123 UDP 是否被打开 | Ø图形化方法: 在 VS Client中, 导航到 Configuration -> Security Profile 并且观察 NTP Client 选择是否开启了外出连接选项。 Ø命令行方法: 键入 "ntpq --p" 检查 /etc/ntp.conf 和/etc/ntp/step-tickers 配置文件中的目标服务器名称和ip地址。 | þ正常 ¨异常 |

1.5 适当的配置MANAGEMENT NETWORK的网络参数

|----------------------|-----------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检测设定的网卡特性是否和实际网络环境相同 | Ø图形化方法: 使用 VS Client 检测物理网卡的速度和全双工状态,带宽速度是固定还是自动协商。 | þ正常 ¨异常 |

1.6 为 Management Network使用固定的IP地址

|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检测DHCP选项是否开启 | Ø图形化方法: 在 VS Client里面, 导航到 Configuration -> Networking 并且点击带有Management Network的虚拟交换机属性,然后点击编辑,点击继续浏览查看DHCP选项是否开启 Ø命令行方法: 键入 "esxcfg-vswif --l" 并且查看DHCP列表项是否在false | þ正常 ¨异常 |

1.7 检查主机是否告警

|---------------------|--------------------------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检测主机硬件是否异常、检查主机是否告警 | Ø图形化方法: 1、在 VS Client里面, 查看主机是否告警 2、主机硬件状态巡检,点击主页上的"主机和集群"图标,然后点击物理机,选中"硬件状态",查看传感器是否为正常状态 | þ正常 ¨异常 |

1.8 其他

|-------------|------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| ESXi命名及域名设置 | ØESXi命名及域名 | þ正常 ¨异常 |

2.1 虚拟交换机是否配置冗余物理网卡

|---------------|-----------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 虚拟交换机是否配置冗余网卡 | Ø通过VS Client查看虚拟交换机配置 | þ正常 ¨异常 |

2.2 物理网卡速率和全双工检查

|-------------------------------------------------|----------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检查网卡速率和全双工。理想状况,每块网卡都是千兆全双工。同一虚拟交换机上的物理网卡速率必须相同 | Ø通过VS Client查看虚拟交换机连接的网卡配置 | þ正常 ¨异常 |

2.3 应用流量和管理流量的分配

|---------------------------------------------------|--------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 应用和管理(Management Network,VMKernel)的网络流量分离到不同的物理网卡 | 通过VS Client查看虚拟交换机连接的网卡配 | þ正常 ¨异常 |

3.1 正确配置存储多路径管理

|---------------------------|-------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| ESXi主机只有一条路径或者有多条路径没有均衡使用 | Ø通过VS Client查看VMFS、HBA和存储路径摘要 | þ正常 ¨异常 |

3.2 虚拟机在LUN上的存储

|---------------------------------------------------------------------------------------------|----------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| Ø如果一个LUN上虚拟机数量超过16台,提醒客户加以注意 Ø对于存放在本地存储的虚拟机,提醒客户加以注意,这些虚拟机不能使用VMotion、DRS或HA迁移 Ø检查虚拟机文件是否正常 | Ø通过VS Client查看每个Datastore上存储的虚拟机 | þ正常 ¨异常 |

4.1 处于不同的管理目的为ESXi服务器使用不同账号

|---------------|-------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检测客户是否有帐户管理机制 | Ø询问客户使用什么账户来完成对ESXi服务器的日常管理目的 | þ正常 ¨异常 |

4.2 限制远端的root登陆ESXi服务器

|--------------|--------------------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 是否有防止恶意攻击的手段 | Ø以root用户登录命令行 察看配置文件/etc/ssh/sshd_config的"PermitRootLogin" 数据项的值是否为真 Ø尝试远程ssh,root登录 | þ正常 ¨异常 |

4.3 出于不同的管理任务使用合适的VC用户帐号和权限

|-------------------|-------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检测VC环境是否有不同用户管理权限 | Ø询问客户是否使用不同的VC用户和权限来完成不同的管理任务 | þ正常 ¨异常 |

4.4 通过使用和合适的VLAN确保不同网络的隔离

|----------------------|-----------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检测是否有和物理环境相适应的虚拟网络设定 | Ø图形化方法: 使用 VS Client 检测虚拟交换机中不同的端口组是否有多VLAN设定 | þ正常 ¨异常 |

4.5 在虚拟交换机上使用安全策略

|----------------------------------------|---------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检测是否在虚拟交换机上设置相适应的安全策略例如,混杂模式,MAC欺骗,伪传输 | Ø图形化方法: 在 VS Client中, 导航到 Configuration -> Networking 并且点击属性查看虚拟交换机的安全选项 | þ正常 ¨异常 |

5.1 虚拟机中正确安装VMware Tools

|----------------------|---------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| VMware Tools安装了正确的版本 | Ø通过VS Client查看虚拟机的VMware Tools版本,工作状态 | þ正常 ¨异常 |

5.2 虚拟机的屏幕保护是否打开

|--------------------|-------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 按虚拟机的安全要求打开或关闭屏幕保护 | Ø通过VS Client访问虚拟机的控制台,查看虚拟的屏幕保护是否打开 | þ正常 ¨异常 |

5.3 虚拟机的外设使用情况

|------------------------------|------------------------------------------|---------|
| 巡检办法 | 巡检项目 | 结果 |
| 通过VS Client访问虚拟机属性,检查虚拟外设的配置 | Ø虚拟机是否用到串并口外设,软驱,光驱。虚机的外设需要满足 VMotion的要求 | þ正常 ¨异常 |

5.4 虚拟机的是否有时钟同步配置

|-----------------------|---------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 对于有准确时钟要求应用,虚机的时钟必须同步 | Ø通过VS Client访问虚拟机属性。检查VMware Tools是否使用时钟同步,或虚机的时钟服务正常工作 | þ正常 ¨异常 |

6.1 许可证情况

|--------------------------------------|----------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 许可证是否不足 是否有ESXi服务器或vCenter服务器仍处于评估模式 | Ø在VS Client中,查看Administration Licenses | þ正常 ¨异常 |

6.2 vCenter服务没有受到其他应用影响

|------------------------------------------------------------------------------------|-----------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| Ø主机配置,内存小于2G,单CPU或磁盘空间不足 Ø操作系统版本及SP与vCenter兼容 Ø是否存在与vCenter服务争用资源或影响vCenter服务运行的应用 | Ø登陆到vCenter主机,输入"winver",Control Panel Add/Remove Program | þ正常 ¨异常 |

6.3 vCenter数据库使用情况

|------------------------------------------------|----------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 数据库版本与SP与vCenter兼容 有足够磁盘空间剩余,满足vCenter数据库未来的增长 | Ø检查vCenter数据库版本与SP Ø检查vCenter数据库所需磁盘空间 | þ正常 ¨异常 |

6.4 HA群集冗余容量

|-------------------------------------|------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| HA群集无警告标识,群集能提供足够冗余资源容量 最近HA虚拟机切换正常 | Ø通过VS Client,查看HA群集设置,检查"Host failure setting" | þ正常 ¨异常 |

6.5 虚拟机CPU Ready和usage

|----------------------------------------------------------------|------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| %Ready经常超过15%或CPU Ready(ms)经常超过3000ms %CPU usage经常超过50% 提醒客户注意 | Ø通过VS Client,Performance页面检查CPU Performance图形以及CPU Ready图形 | þ正常 ¨异常 |

6.6 vCenter与ESXi主机服务器时间

|------------------|------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 查看时间是否一致,并提醒客户注意 | Ø通过VS Client,查看vCenter时间,并与ESXi主机服务器时间对比 | ¨正常 þ异常 |

6.7 Anti-Affinity设置

|------------------------------------|----------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检查不适合放在同一台主机的虚拟机,是否配置Anti-Affinity | Ø通过VS Client,编辑DRS群集的设置,查看虚拟机Anti-Affinity设置 | þ正常 ¨异常 |

6.8 vCenter监控设置

|---------------------------------|-----------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| CPU、内存、网络、磁盘IO等出现问题时,是否有必要的告警设置 | Ø通过VS Client,检查Datacenter、ESXi主机服务器、资源池或虚拟机上Alarm设置 | þ正常 ¨异常 |

6.9 vCenter性能监控

|-----------|------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 检查性能是否有问题 | Ø通过VS Client,检查Performance当中CPU、内存、网络和Disk IO。 | þ正常 ¨异常 |

7.1 是否有控制生产环境改变的变更流程控制

|------------------|-------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 是否存在相应的虚拟化生产变更手册 | Ø询问客户是否有对关键应用的变更说明书可以追溯 | þ正常 ¨异常 |

7.2 是否有相适应的操作手册来控制日常管理

|----------------|------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 是否存在相应的虚拟化操作手册 | Ø询问客户是否有相应的操作手册用以进行日常虚拟机管理(例如虚拟机的供给,性能的监控,日常问题的处理方法) | þ正常 ¨异常 |

8.1 是否有冗余的电源管理

|---------------|-----------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 是否存在电源的单点故障风险 | Ø询问客户是否有对虚拟化环境相应硬件环境的双电源管理(例如pc server,LAN Switch,SAN Switch,storage Array) | þ正常 ¨异常 |

8.2 是否有供VC和license server使用的热切换机制,针对网络的冗余网卡,存储多路径管理

|--------------|---------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 是否存在相应单点故障风险 | Ø询问客户是否有VC和license server的热切换机制,每台ESXi服务器是否采用冗余网卡设计,存储有无多路径管理 | þ正常 ¨异常 |

8.3 是否有虚拟机的备份和恢复流程

|----------------------------------------|--------------------------------------------------------------------------------------------------|---------|
| 巡检项目 | 巡检办法 | 结果 |
| 是否存在备份和恢复流程,有没有做过备份和恢复的演练,有没有文档化备份恢复流程 | Ø询问客户是否有相应的流程来备份和恢复虚拟机 Ø询问客户通常采用哪种备份手段来备份虚拟机内容(文件级还是虚拟机全镜像) Ø询问客户是否已经文档化的规定了虚拟机的备份和恢复流程,并且日后用于查看 | þ正常 ¨异常 |

相关推荐
漠北的哈士奇14 小时前
VMware Workstation导入ova文件时出现闪退但是没有报错信息
运维·vmware·虚拟机·闪退·ova
小周学学学1 天前
vmware的python自动化:批量迁移虚拟机
运维·自动化·vmware·虚拟化
小周学学学2 天前
vmware的python自动化:批量给esxi主机挂载iscsi动态目标
运维·自动化·vmware·虚拟化
新的算法5 天前
通过重装vCenter Server解决登录vCenter界面时,报“503 Service Unavailable“错误的问题
运维·vmware·虚拟化
DarkAthena5 天前
【ESXI】断电重启后NFS存储无法识别的修复方案
esxi·虚拟机·nfs
爱学习的小囧6 天前
零门槛!VCF 自动化环境登录 vSphere Supervisor 全教程
运维·服务器·算法·自动化·vmware·虚拟化
【ql君】qlexcel6 天前
Vmware安装虚拟机出现此主机不支持64位客户机操作系统问题
ubuntu·vmware·虚拟机·不支持64位
小周学学学7 天前
ESXI虚拟机故障关机处理记录
服务器·vmware·虚拟化
爱学习的小囧7 天前
VCF 9.0 操作对象与指标报告自动化教程
运维·服务器·算法·自动化·vmware·虚拟化
Johny_Zhao13 天前
OpenClaw中级到高级教程
linux·人工智能·信息安全·kubernetes·云计算·yum源·系统运维·openclaw