目录
- [1. 定义](#1. 定义)
- [2. 主要作用](#2. 主要作用)
- [3. 实现方法](#3. 实现方法)
- [4. 实现原理](#4. 实现原理)
1. 定义
负载均衡(Load Balancing)将网络流量、请求等输入分发到后端服务器,为后端服务器提供负载均衡,实现高可用和容错。
2. 主要作用
1. 高并发
通过将请求均匀分配到多个服务器上,提高系统的并发处理能力。
2. 容错
当某个服务器不可用时,负载均衡器会自动将请求分发给其他可用的服务器,确保系统的高可用性。
3. 压力均衡
将请求按照一定的规则分发到不同的后端服务器,实现负载均衡,使每个服务器负载均衡。
3. 实现方法
1. 硬件负载均衡
通过交换机、路由器等设备,将网络流量分发到后端服务器。常见的硬件负载均衡设备有:F5 BIG-IP、Cisco ASA、Palo Alto Networks、Fortinet、Huawei、Zyxel等。
硬件负载均衡具有高性能、高稳定性、高可用性等优点,但缺点是价格高、配置复杂等。
2. 软件负载均衡
软件负载均衡可分为基于客户端的负载均衡和基于服务器的负载均衡两种方式。基于客户端的负载均衡从服务注册中心拉取服务列表,并将服务器列表维护在本地 ,发送请求时从本地的服务器列表中选取一个发送请求;而基于服务器的负载均衡将请求发送到负载均衡器,再由负载均衡器将请求分发到后端服务器,服务列表在负载均衡器中维护。
常见的基于客户端的负载均衡器有:Ribbon、Feign、gRPC、Consul等。常见的基于服务器的负载均衡器有:Nginx、HAProxy、LVS等。
软件负载均衡具有灵活、高可扩展性、成本低等优点,但缺点是维护复杂、性能有限等。
4. 实现原理
软件负载均衡的原理是:
-
负载均衡器维护一个或多个后端服务器的IP地址列表;
-
通过心跳机制定期检查后端服务器的状态,将不可用的服务器从列表中移除,以此确保负载均衡器的可用性;
-
当有请求到达负载均衡器时,负载均衡器会根据一定的规则(如轮询、哈希等)将请求分发到后端服务器。