【Nginx】Nginx负载均衡

负载均衡：通过反向代理来实现

Nginx的七层代理和四层代理：

七层是最常用的反向代理方式，只能配置在nginx配置文件的http模块当中；配置的方法名称为：upstream模块，不能写在server中也不能写在location中，在http模块当中是独立的一个配置

七层代理：代理的是http的请求和响应

复制代码

客户端------------发起http请求------------七层代理（代理服务器）------------代理服务器转发http请求到内部的一组服务器（web集群）

过程中客户端并不知道请求的是代理服务器还是内部服务器，而且通过代理服务器隐藏了内部服务器的ip

实际上，客户端访问的是代理服务器；请求通过代理服务器转发给web服务器，web服务器响应；

四层代理：

是基于tcp/ip协议层的代理转发方式；可以实现基于IP地址和端口进行负载均衡转发

四层代理无法获取http请求当中的URL信息，只能对tcp/udp数据包进行转发；也就是对流量转发

配置方法：stream；stream不能配置在http模块中，配置在全局当中，是属于一个独立的模块，不属于其他任何模块

1.四层代理和七层代理的区别（面试***）

四层代理是基于IP地址和端口号进行的，只负责转发请求，速度较快；

四层代理不能进行流量控制，也没办法对内容进行过滤

七层代理是通过http请求，四层走的是tcp/udp的数据包，转发的是流量

七层代理的特点：基于http协议进行；可以对请求进行深入地解析和处理（流量控制、内容的过滤）

四层：适用于需要高效处理大量连接请求的场景： TCP 和 UDP 协议的负载均衡；

七层：适用于对请求进行精确处理和控制的场景：Web 应用程序的负载均衡

2.四层和七层哪个速度更快（面试）

四层代理相比七层更快；

四层只是流量转发，不能对请求进行解析和控制；快

四层代理是通过内核转发的流量；快

七层代理，需要对请求进行处理和解析；慢

七层的访问控制、流量处理是通过用户态进行的；慢

七层代理可以提供更高级的服务和用户体验

正向代理：

正向代理是面向客户端的；当客户端的IP地址被web服务器禁止访问后，（客户端）可以通过代理服务器去访问web服务器；

web服务器只会知道是代理服务器的ip访问的它，而不知道是客户端

复制代码

proxy_pass    #配置代理服务器访问的地址；只能写在location模块中

应用：
    正向代理更多的用在公司内网，公司内员工的主机都通过一个代理服务器访问互联网，

    而互联网上被访问的服务器，只知道代理服务器的ip，不知道公司内员工的ip，主要作用：加速，翻墙

反向代理：***

客户端直接访问代理服务器

两者都是通过客户端访问代理服务器，代理服务器转发请求或者流量到后端服务器，后端的web服务器会有多台，用户并不知道最终访问的是哪一台服务器

负载均衡具有：高可用、可扩展、提高可维护性

工作中你是怎么做反向代理的（面试*）

反向代理就是负载均衡，根据场景的并发量来确定负载均衡的算法

并发量小:可以使用默认轮询，配合最小连接数使用即可

高并发：ip_hash或者url_hash来实现，访问一次之后，就不会再切换后端web服务器，下一次访问的就是缓存，速度快、后台web服务器的请求压力也会变小

upstream 基于http实现负载均衡；反向代理；

特点：

复制代码

http请求的负载均衡方式
没有缓存
默认为轮询算法

1.轮询算法（rr）

会将请求轮流分配给后端服务器，轮询算法适用于 web服务器处理能力相近的情况；默认算法，可以不加

复制代码

vim /usr/local/nginx/conf/nginx.conf

    #gzip on;
    upstream ky30 {
        server 192.168.220.20;
        server 192.168.220.30;
    #指定通过代理服务器10，会把http的请求转发到20或者30上
    }



    location / {
        root    html;
        index   index.html index.htm;
        proxy_pass http://ky30;
    }

2.加权轮询算法

建立在轮询算法的基础之上，通过给不同的web服务器分配权重，让处理能力更强的服务器可以分配到更多的请求；

虽然配置了权重值，但是轮询的结果未必准确

复制代码

vim /usr/local/nginx/conf/nginx.conf

    #keepalive_timeout 0;
    keepalive_timeout 65;

    #gzip on;
    upstream ky30 {
        server 192.168.220.20 weight=2;
        server 192.168.220.30 weight=3;
    #通过代理服务器10，转发http请求时，网权重高的服务器上转发的次数会更多，权重少的转发就少
    }

3.ip_hash算法

会根据IP地址计算出一个hash值，使用ip_hash算法，同一个客户端的请求会被分配到同一个后端服务器，可以保证会话的稳定性；

如果后端服务器的数量发生变化，hash值会重新计算，请求的服务器也会发生变化

4.最少连接数算法least_conn

可以轮询，会将请求发送到当前连接数最少的web服务器

主要适用于后端服务器处理任务耗时不同的情况，避免了所有请求集中在处理能力更强的后端服务器上，可以和加权轮询配合使用

5.url_hash算法

根据uri 地址计算hash值；使用url_hash，相同请求的uri会分配到同一个后端web服务器

复制代码

vim /usr/local/nginx/conf/nginx.conf

    #gzip on;
    upstream ky30 {
        hash $request_uri consistent;
        server 192.168.220.20 weught=2;
        server 192.168.220.30 weight=3;

    }

负载均衡的核心就是各类算法

小场景：并发量很小，默认算法就可以满足适应条件

中等：后端web服务器的处理能力有差异：加权轮询，和最小连接数配合使用

大型并发：使用ip_hash或者url_hash；第一次请求之后会有本地缓存，可以提高后续访问速度，因为hash算法的原因，请求的后台web服务器不会发生变化；减轻了后台服务器的请求压力

ip_hash；后端服务器数量发生变化，请求的服务器也会发生变化

url_hash；请求的地址发生变化，请求的服务器也可能会发生变化

stream

默认不带轮询；可以使用的轮询方式

算法：除不支持url_hash外，其他与upstream相同

实验

1.七层:

http IP地址

http 域名

2.四层：

stream