原文链接 What Is Load Balancing? | IBM
什么是负载均衡?
在多台服务器之间高效的分配网络流量的过程,以优化应用程序的可用性,同时确保积极的用户体验。
电商网站依赖负载均衡(load balancing)来确保web应用能够无延迟,不停机的发送数据到用户端。
负载均衡如何工作的?
负载平衡可以通过几种方式实现。
【硬件负载平衡器(load balancers)】是在本地(on premises)安装和维护的物理设备(physical appliance)。
【软件负载平衡器】是安装在私有(privately-owned)服务器上或作为托管云服务(managed cloud service)(云负载均衡)的应用程序。
负载均衡器通过实时调解(mediating)来自客户端的请求并确定哪些后端服务器最适合处理这些请求来工作。为了防止单个服务器过载(overloaded),负载均衡器会将请求路由(routes)到任何数量的本地( on premises)或托管在服务器农场(hosted in server farms)或云数据中心的可用服务器上。
一旦分配的服务器接收到请求,它会通过负载均衡器向客户端做出响应。然后,负载均衡器通过将客户端的IP地址与选定服务器的IP地址匹配来完成服务器到客户端的连接。客户端和服务器然后能够进行通信并执行所需的任务,直到会话结束。
如果网络流量突然增加(spike),负载均衡器可能会启动额外的服务器以满足需求。
或者,如果网络流量暂时减少(lull),负载均衡器可能会减少可用服务器的数量。
它还可以通过将**流量路由到缓存服务器(cache servers)**来辅助网络缓存,缓存服务器临时存储以前的用户请求。
负载均衡的好处
高可用 (Availability)
负载平衡器在将请求路由到服务器之前对服务器执行健康检查(health checks)。
如果一台服务器即将发生故障,或因维护或升级而离线,负载平衡会自动将工作负载重新路由到工作服务器,以避免服务中断(interruptions)并保持高可用性。
易扩展 (Scalability)
负载平衡实现了按需(on-demand)的高性能( high-performance)基础设施,可以处理最重或最轻的网络流量负载。
可以根据需要添加或删除物理或虚拟服务器(Physical or virtual ),使可扩展性变得简单和自动化。
安全 (Security)
负载均衡器可以包括安全功能,
如SSL加密、
web应用程序防火墙(web application firewalls aka WAF)和
多因素身份验证(multi-factor authentication aka MFA)。
它们还可以被整合到应用交付控制器(application delivery controllers aka ADC)中,以提高应用安全性。
通过安全地路由或卸载(routing or offloading)网络流量,负载平衡可以帮助防御分布式拒绝服务攻击(distributed denial-of-service aka DDoS)等安全风险。
负载均衡算法
针对不同的情况,使用不同的算法。
轮询(Round robin)
最少工作量此算法使用域名系统( Domain Name System aka DNS)以连续轮换( continuous rotation)的方式将请求顺序(sequentially)分配给每个服务器。
这是最基本的负载平衡方法,因为它只使用每个服务器的名称来确定哪个服务器接收下一个传入请求。
加权轮询(Weighted round robin)
除了DNS名称外,此算法中的每个服务器还被分配了一个"权重(weight)"。
权重决定了哪些服务器应该比其他服务器具有处理传入请求的优先级(priority)。
管理员(administrator)根据每个服务器的容量和网络需求决定如何对其进行加权。
IP哈希(IP hash)
计算将传入请求的IP地址简化(或哈希)(simplifies (or hashes))为一个称为哈希键(hash key)的较小值。然后,这个唯一的哈希键(hash key)(代表用户的IP地址)被用作决定如何将请求路由到特定服务器的基础。
最少连接(Least connections)
顾名思义,当收到新的客户端请求时,此算法会优先考虑活动连接最少的服务器(fewest active connections)。这种方法有助于防止服务器因连接而过载(overloaded),并始终保持服务器之间的负载一致(consistent load)。
最快响应(Least response time)
该算法将最少连接(least connection)方法与最短(shortest)的平均服务器响应时间相结合。连接数量以及服务器执行请求和发送响应所需的时间都会被评估。具有最少活动连接的最快服务器将接收传入请求。
负载均衡器的类型
虽都是分发流量,但针对特定功能有特定类型的负载均衡器。
网络负载平衡器 (Network load balancers)
优化流量,减少局域网和广域网的( local and wide area networks)延迟。它们使用IP地址和目标端口(destination ports)等网络信息,以及TCP和UDP协议来路由网络流量,并提供足够的吞吐量(throughput)来满足用户需求。
应用层负载均衡器 (Application load balancers)
使用诸如URLs, SSL sessions 和 HTTP headers之类的应用层内容(application content)来路由API请求流量。由于多个应用层服务器存在重复功能,检查应用层( application-level )内容有助于确定哪些服务器可以快速可靠地满足特定请求。
虚拟负载平衡器**(Virtual load balancers)**
随着虚拟化(virtualization)和VMware技术的兴起,虚拟负载平衡器(virtual load balancers)现在被用来优化服务器、虚拟机和容器之间的流量。Kubernetes等开源容器编排工具(orchestration tools)提供了虚拟负载平衡功能,可以在集群中容器(containers)的节点(nodes)之间路由请求**。**
全局服务器负载平衡器 ( Global server load balancers)
这种类型的负载均衡器将流量路由到多个地理(geographic)位置的服务器,以确保应用程序的可用性。用户请求可以分配给最近(closest)的可用服务器,或者如果服务器发生故障,可以分配给另一个有可用服务器的位置。这种故障转移功能(failover capability)使全局服务器负载平衡成为灾难恢复的重要组成部分。