Nginx 负载均衡调度算法

一、负载均衡简介

Nginx是一个高性能的开源Web服务器和反向代理服务器，其负载均衡功能是其核心特性之一。负载均衡是一种分布式计算技术，用于将网络流量和用户请求分散到多台服务器上，以此来提高网络服务的可用性和可靠性。它通过优化资源使用、最大化吞吐量以及最小化响应时间，增强了网络、服务器和数据中心的伸缩性和灵活性。

Nginx的负载均衡功能主要通过其反向代理模式实现。当客户端发送请求到Nginx服务器时，Nginx会根据预设的负载均衡策略将请求转发给后端服务器，并将后端服务器的响应返回给客户端。Nginx作为代理服务器，有效地分摊了请求压力，提高了系统的处理能力。

原理：默认调度算法，将客户端请求按顺序轮流分配到后端服务器（如 A→B→C→A→B→C...），不考虑服务器负载、性能差异或连接数。

适用场景：

后端服务器硬件配置、性能一致（如规格相同的云服务器）；

各服务器处理请求的时间相近，且无会话保持需求；

简单的无状态服务（如静态资源服务、API 接口服务）。

原理：为后端服务器分配权重（weight 参数，默认值为 1），权重越高的服务器接收的请求越多。例如，服务器 A 权重为 3、服务器 B 权重为 1，则请求分配比例约为 3:1（A→A→A→B→A→A→A→B...）。

适用场景：

后端服务器性能不均（如部分服务器配置更高、处理能力更强）；

需要根据服务器承载能力分配负载（如高配服务器承担更多请求）；

混合部署的集群（如物理机与虚拟机共存的场景）。

原理：根据客户端 IP 地址的哈希值分配请求，同一 IP 地址的请求会固定转发到同一台后端服务器（除非该服务器下线）。

适用场景：

需要会话（Session）保持的服务（如用户登录状态、购物车信息存储在服务器本地内存中）；

避免同一用户的请求分散到不同服务器导致的会话失效问题；

对客户端 IP 稳定性要求较高的场景（如企业内网服务，IP 相对固定）。

原理：优先将请求分配给当前活跃连接数最少的后端服务器，动态平衡负载（而非固定顺序）。例如，服务器 A 当前有 5 个连接，服务器 B 有 2 个连接，则新请求会分配给 B。

适用场景：

请求处理时间差异较大的服务（如有的请求需要复杂计算，耗时较长；有的请求简单，耗时短）；

避免某台服务器因积累大量长连接（如文件上传、视频流）而过载；

动态调整需求高的场景（如流量波动大的电商服务）。