NGINX 提供多种负载均衡方法,以应对不同的流量分发需求。常用的算法包括:最少连接、最短时间、通用哈希、随机算法和 IP 哈希。这些负载均衡算法都通过独立指令来定义,每种算法都有其独特的应用场景。
以下负载均衡方法(IP 哈希除外)适用于 HTTP、TCP 和 UDP 上游池:
轮询
轮询(Round Robin)是 NGINX 默认的负载均衡方法,按服务器列表的顺序分发请求。此方法适用于所有服务器具有相似性能的场景。
加权轮询:如果服务器的处理能力不同,可以通过 weight 参数进行权重设置。权重越高,服务器接收的请求越多。加权轮询的基本原理是通过加权平均值来决定流量分配。
最少连接
least_conn 方法通过将请求代理到当前连接数最少的服务器,帮助优化资源利用率。它非常适用于处理长时间连接(如 WebSocket)的场景。权重同样可以结合使用,以进一步控制负载分配。
最短时间
least_time 仅在 NGINX Plus 中提供,是一种更加智能的负载均衡算法。它不仅考虑服务器的连接数,还优先选择响应时间最短的服务器。这种方法特别适合高性能应用,能够帮助减少延迟并提高响应速度。
参数设置:用户需指定 header(使用响应头的时间)或 last_byte(使用完整响应的时间)作为优化依据。可选参数 inflight 还可以将未完成的请求考虑在内。
通用哈希
hash 算法根据管理员定义的哈希值(基于请求的特定文本、变量或两者结合)将请求定向到特定服务器。这种方法在需要请求始终发往同一服务器的场景(如缓存或会话一致性)中非常有用。
注意事项:当服务器池发生变化(添加或删除服务器)时,哈希分配会重新计算,因此某些会话可能会重新路由。
随机算法
random 算法用于在服务器池中随机选择一台服务器处理请求。它支持 weight 参数来影响服务器的选择概率。通过 two [method] 参数,NGINX 可随机选择两台服务器,并使用指定的负载均衡方法(如 least_conn)在这两台服务器间分配请求。
IP 哈希
ip_hash 仅适用于 HTTP 协议。此方法基于客户端 IP 地址的哈希值,将请求分配到特定服务器。使用此方法可以确保来自同一客户端的请求始终被分发到同一台服务器,特别适合需要维持会话一致性的应用场景。
IP 哈希的工作原理:IP 哈希算法使用 IPv4 地址的前三个八位组或完整的 IPv6 地址生成哈希值。这不同于通用哈希算法,后者使用远程变量来生成哈希。
最后
每种负载均衡算法都有其独特的优势和应用场景,结合需求,合理选择负载均衡方法能够显著提升系统的性能和可用性