vSphere DRS与vSphere HA

目录

[1.vSphere DRS](#1.vSphere DRS)

[1.1vSphere DRS介绍](#1.1vSphere DRS介绍)

[1.2vSphere DRS要求](#1.2vSphere DRS要求)

[2.配置vSphere DRS](#2.配置vSphere DRS)

[3.vSphere HA](#3.vSphere HA)

[3.1vSphere HA介绍](#3.1vSphere HA介绍)

[3.2vSphere HA要求](#3.2vSphere HA要求)

[4.配置vSphere HA](#4.配置vSphere HA)


1.vSphere DRS

1.1vSphere DRS介绍

vSphere DRS 的全称是 vSphere Distributed Resource Scheduler,即分布式资源调度器。它持续监控整个集群(由多台ESXi物理服务器组成)中所有主机(Host)的资源(主要是CPU和内存)使用情况,并自动、智能地将虚拟机(VM)迁移到最合适的主机上运行,以确保资源利用最优化。

DRS的主要作用可以归结为以下几点:

  1. 自动负载均衡(自动化运维)

这是DRS最广为人知的作用。

场景:假设一个集群里有3台主机。当其中一台主机上的虚拟机负载突然变高(例如,CPU使用率持续超过80%),而另一台主机还很空闲。

DRS的动作:DRS会自动计算,并将那台高负载主机上的一个或多个虚拟机,通过 vMotion(无中断在线迁移) 技术,实时迁移到空闲的主机上。

结果:避免了单台主机过载导致的性能瓶颈,同时充分利用了所有主机的资源,实现了集群整体的负载均衡。

  1. 智能初始放置(开机的智慧)

当你在一台DRS集群中开启一台新的虚拟机时,DRS会立刻计算。

场景:你需要启动一台新的数据库服务器。

DRS的动作:DRS不会随机或在指定主机上启动它,而是会自动分析集群中所有主机的当前负载、剩余资源,并选择最合适的一台主机来放置并启动这台新虚拟机。

结果:从虚拟机"诞生"的那一刻起,就获得了最佳的性能起点,无需手动选择主机。

  1. 执行维护模式(无感维护)

当需要对某台ESXi主机进行硬件维护、升级或重启时。

场景:你需要将主机A关机进行内存扩容。

DRS的动作:你只需将主机A置入"维护模式"。DRS会自动识别,并将这台主机上运行的所有虚拟机,通过vMotion安全、无中断地迁移到集群中的其他主机上。

结果:业务零停机,管理员无需手动一台台迁移虚拟机,维护工作变得极其简单。

  1. 关联性与反关联性规则(业务逻辑调度)

DRS允许你设置高级规则,以满足特定的业务或高可用性需求。

关联性规则:强制让某些虚拟机(如一个应用的多层组件)始终运行在同一台主机上,以减少网络延迟。

反关联性规则:强制让某些虚拟机(如两个域控制器,或主备数据库)始终分开运行在不同的主机上。

场景:你有两个关键的Web服务器,需要避免单台主机故障导致服务全部中断。

DRS的动作:你创建一个"反关联性规则"将这两个Web服务器分开。DRS会始终确保它们运行在不同的物理主机上。

结果:提升了服务的容错能力和高可用性。

1.2vSphere DRS要求

1.共享存储要求

DRS 集群具有特定的共享存储要求。

确保受管主机使用共享存储。共享存储通常位于 SAN 上,但也可以通过使用 NAS 共享存储来实现。

2.共享的 VMFS 卷要求

DRS 集群具有某些共享的 VMFS 卷要求。

配置所有受管主机以使用共享 VMFS 卷。

将所有虚拟机的磁盘置于可通过源主机和目标主机访问的 VMFS 卷上。

确保 VMFS 卷足够大,可以存储虚拟机的所有虚拟磁盘。

确保源主机及目标主机上的所有 VMFS 卷都使用卷名称,并且所有虚拟机都使用这些卷名称来指定虚拟磁盘。

3.处理器兼容性要求

DRS 集群具有特定的处理器兼容性要求。

为了避免限制 DRS 的功能,应当将集群内源和目标主机的处理器兼容性最大化。

vMotion 在底层 ESXi 主机之间传输虚拟机的运行架构状况。vMotion 兼容性是指目标主机的处理器必须能够使用等效指令,从源主机的处理器在挂起时的状态继续执行。处理器时钟速度和缓存大小可能不同,但处理器必须属于相同的供应商类别(Intel 与 AMD)和相同的处理器系列,以便达到通过 vMotion 迁移所需的兼容性。

4.DRS 集群的 vMotion 要求

DRS 集群具有特定的 vMotion 要求。

要启用 DRS 迁移建议的使用,集群内的主机必须是 vMotion 网络的一部分。如果主机不在 vMotion 网络中,DRS 仍可提供初始放置位置建议。

要为 vMotion 进行配置,集群内的每台主机必须满足下列要求:

vMotion 不支持裸磁盘,也不支持对借助于 Microsoft 集群服务 (MSCS) 集群的应用程序进行迁移。

vMotion 要求在所有启用了 vMotion 的受管主机之间设置专用的千兆以太网迁移网络。在受管主机上启用 vMotion 后,需要为受管主机配置唯一的网络标识对象并将其连接到专用迁移网络。

官方链接如下

https://techdocs.broadcom.com/cn/zh-cn/vmware-cis/vsphere/vsphere/8-0/vsphere-resource-management-8-0/creating-a-drs-cluster.htmlhttps://techdocs.broadcom.com/cn/zh-cn/vmware-cis/vsphere/vsphere/8-0/vsphere-resource-management-8-0/creating-a-drs-cluster.html

2.配置vSphere DRS

我这里集群中有3台esxi主机,CPU型号均为Intel(R) Xeon(R) Silver 4210R CPU @ 2.40GHz

3台esxi主机搭建了VSAN

配置了vmotion服务的VMK适配器

从集群-配置-vSphere DRS,点击编辑开启DRS

点击左上角的vSphere DRS,开启服务,然后确定即可

这里重点讲一下自动化级别

全自动

vSphere DRS会自动调度虚拟机迁移,保证集群内esxi主机的负载均衡

打开虚拟机电源时,DRS 会自动将虚拟机置于主机上,且虚拟机将自动从一个主机迁移到其他主机以优化资源利用率。

半自动

vSphere DRS只会在虚拟机创建的时候根据各个主机的负载情况进行均衡放置,如果集群内主机集群负载不均衡,会在DRS建议里告诉你迁移建议,需要手动点击应用才会进行迁移

打开虚拟机电源时,DRS 会自动将虚拟机置于主机上。需要手动应用或忽略迁移建议。

手动

vSphere DRS只会在DRS建议里提示迁移建议,需要手动点击应用才会进行迁移

DRS 会为虚拟机生成打开电源放置建议和迁移建议。需要手动应用或忽略建议。

开启之后可以在集群-监控-vSphere DRS-历史记录里面看到迁移纪录

如果自动级别为半自动或者手动,则需要在集群-监控-vSphere DRS-建议里面点击应用建议才会进行虚拟机的迁移

一般来说vSphere DRS的配置就完成了,但是某些情况下我们要求某些虚拟机的不能在同一台主机上(比如主副域控不能在同一台esxi主机上,否则单台esxi故障导致域内没有可用的域控制器),我们就可以指定规则来限制虚拟机的DRS

比如我这里有两台测试虚拟机,我需要测试虚拟机01只放置在172.16.201.72上,测试虚拟机02只放置在172.16.201.73上

点击集群-配置-配置-虚拟机/主机组,点击添加

名称可以自定义,添加-选择我们加入到该组的虚拟机,然后点击确定

主机组与虚拟机组一致,类型选择主机组,名称自定义,添加选择对应的esxi主机,点击确定

把虚拟机组以及主机组按要求创建好

来配置虚拟机-主机绑定规则,点击集群-配置-配置-虚拟机/主机规则,点击添加

类型选择虚拟机到主机,名称自定义,然后点击确定

配置好我们想要的规则

配置好后,DRS会按照规则进行迁移

3.vSphere HA

3.1vSphere HA介绍

vSphere HA (High Availability) 是 VMware vSphere 的一项核心集群功能,主要目的是当物理服务器、虚拟机或应用发生故障时,能自动、快速地重启受影响的虚拟机,从而以较低的成本为所有虚拟机提供基础的高可用性保护,保障业务连续。

vSphere HA 的核心功能是为集群内所有虚拟机提供基础架构层面的高可用性自动保护。它主要防范五大类故障:针对物理主机故障,它能自动在其他健康主机上重启虚拟机;针对客户机操作系统或应用无响应,它能通过监控VMware Tools自动重启该虚拟机;针对数据存储可访问性丢失,它能利用存储心跳机制,在仍能访问存储的主机上恢复业务;针对主机网络隔离,它能通过Ping隔离地址进行判断并执行恢复,防止"脑裂";针对存储设备路径故障,其高级功能VMCP可应对特定存储错误场景。其工作原理基于集群内持续的心跳检测,一旦判定故障发生,便会根据预定义策略,自动、快速地在别处恢复虚拟机,从而以简单统一的方式为所有负载构建起一道恢复基线。

3.2vSphere HA要求

  • 所有主机必须获得 vSphere HA 许可。
  • 集群必须至少包含两个主机。
  • 必须为所有主机配置静态 IP 地址。如果使用的是 DHCP,必须确保每台主机的地址在重新引导期间保留。
  • 所有主机必须至少有一个共有的管理网络。最佳做法是至少有两个共有的管理网络。您应使用已启用管理流量复选框的 VMkernel 网络。这些网络必须能够相互访问,且管理网络上的 vCenter Server 和主机必须能够相互访问。请参见网络连接的最佳做法。
  • 为了确保任何虚拟机都可以在集群内的任何主机上运行,所有主机都必须可以访问相同的虚拟机网络和数据存储。同样,虚拟机必须位于共享而非本地存储上,否则在主机出现故障时它们将无法进行故障切换。

官方链接如下

vSphere HA 对照表https://techdocs.broadcom.com/cn/zh-cn/vmware-cis/vsphere/vsphere/7-0/vsphere-availability/creating-and-using-vsphere-ha-clusters/creating-a-vsphere-ha-cluster/vmware-ha-checklist.html

4.配置vSphere HA

集群-配置-服务-vSphere可用性,点击编辑

点击左上角的vSphere HA开启服务,点击确定

服务开启之后,可以在集群-监控-vSphere HA-摘要里面看到主机和虚拟机的HA状态

我这边有台horizon的虚拟机,放在172.16.201.73这台esxi主机上,我们对esxi主机进行关机,看下ha能够正常把horizon虚拟机重新在其他esxi主机上拉起来

可以从虚拟机-健康-任务和事件-事件中看到ha把这台虚拟机重新拉起来了,放置在72的esxi服务器上

当然某些情况下,我们期望HA能够恢复特定虚拟机但不重新启动,就需要修改这些虚拟机的HA配置。集群-配置-虚拟机替代项,点击添加

选择要进行设置的虚拟机(我这里以horizon为例)

修改虚拟机重新启动优先级为禁用,点击完成(HA只会恢复虚拟机到正常的esxi主机,但是不会启动虚拟机)

因为我这边的环境相当于简单,所以对于DRS以及HA的应用较为简单,如果对于DRS以及HA有更复杂的要求,建议多看官网文档,根据自行需求配置规则。

相关推荐
德迅云安全—珍珍2 小时前
主机安全-德迅卫士
linux·服务器·安全
咕噜企业分发小米2 小时前
如何平衡服务器内存使用率和系统稳定性?
java·服务器·前端
2301_805962932 小时前
Windows连接腾讯云服务器
服务器·windows·腾讯云
云动课堂2 小时前
一键升级 OpenSSH 10到最新版:告别手工编译、兼容国产系统、批量部署无忧!
linux·服务器·centos
倔强的小石头_2 小时前
Python 从入门到实战(八):类(面向对象的 “对象模板”)
服务器·开发语言·python
小周学学学2 小时前
vcenter的SMB备份
运维·服务器·vmware·虚拟化
qq_310658513 小时前
mediasoup源码走读(十二)——router
服务器·c++·音视频
BullSmall3 小时前
Apache Doris 精细化调优配置指南
linux·运维·服务器·database
QT 小鲜肉3 小时前
【Linux命令大全】001.文件管理之chattr命令(实操篇)
linux·运维·服务器·笔记