nginx负载均衡 - 技术栈

我所理解的负载均衡，就是：

能够将客户端的请求均匀地分发到后台各个应用服务器上，从而缓解服务器压力。
并且当服务器出现宕机或者扩容时，也能正常运行。

负载均衡的方法

上面了解了什么是负载均衡，那么Nginx是怎么实现这个功能的呢？

Nginx中负责与上游交互的模块，统称为upstream模块。

而指定上游服务地址是通过upstream和server指令完成的，其关系为：

指定上游服务器的address时，其地址可以是域名、IP地址或者unix socket地址。

可以在域名或者IP地址后加端口，如果不加端口，那么默认使用80端口。

在address后面可以添加一些参数，比如：

backup：指定当前server为备份服务，仅当非备份server不可用时，请求才会转发到该server。

down：标识某台服务已经下线，不再服务。

举个例子：

复制代码

upstream upstream-service {
        server 127.0.0.1:17002;
        server 127.0.0.1:17000;
    }

在upstream这个模块中，它还提供了一个最基本的负载均衡算法round-robin。

其功能是：

以加权轮询的方式访问server指令指定的上游服务。

这个算法是默认集成在Nginx的框架中，无法移除，所以后面讲解的所有算法都是基于此，所有算法在某些特殊情况下最终都会变成round-robin。

涉及到的指令有：

weight：服务访问的权重，默认是1。
max_conns：server的最大并发连接数，仅作用于单worker进程。
max_fails：在fail_timeout时间内，最大的失败次数。当达到最大失败时，会在fail_timeout时间内不允许再次被选择。
fail_timeout：单位为秒，默认是10秒。指定一段时间内，最大的失败次数max_fails。到达max_fails后，该server不能访问的时间。

有的时候，正常的轮询算法并不能满足我们的需求，

比如：带有cookie请求状态的连接，如果应用服务没有设置专门的管理cookie的服务器，那么我们就希望同一个用户能被分配到同一个服务器。

再比如：我们后端应用需要针对请求当中的参数或者URL，将相同的请求放到相同的服务器上进行处理。

针对第一种情况，就可以用upstream_ip_hash。针对第二种情况，可以使用upstream_hash。

功能：

以客户端的IP地址作为hash算法的关键字，映射到特定的上游服务器中。

功能：

通过制定关键字作为hash key，基于hash算法映射到特定的上游服务器中。

举个例子(以请求中的参数username作为hash key)：

复制代码

upstream upstream-service {
        hash user_$arg_username;
        server 127.0.0.1:17002;
        server 127.0.0.1:17000;
    }