nginx 限速之limit_req

nginx_http_limit_req_module用于限制定义key(单个ip)的请求的处理速度限制的方法如同漏斗,每秒固定处理请求数,推迟过多请求,如但客户端ip的每秒请求数.还可以用于安全防护,限制密码撞库暴力破解等操作频率,也可以通过把请求频率限制在一个正常范围来抵御ddos攻击,不过更常见的使用情况是通过限制请求的数量来确保后端的upstream服务器不会在短时间内遭受到大量的流量访问从而导致服务异常。

1. 工作原理

nginx 中限速(rate limiting)的主要算法原理是漏斗算法:基本原理就是以漏斗算法,基本原理就是:以漏斗为例,水从顶部倒入,从底下漏出.

在桶满后该算法有两种处理方式Traffic Shaping和Traffic Policing

暂时拦截住上方水的向下流动，等待桶中的一部分水漏走后，再放行上方水。
溢出的上方水直接抛弃。

将水看作网络通信中数据包的抽象，则方式1起到的效果称为Traffic Shaping，方式2起到的效果称为Traffic Policing

由此可见，Traffic Shaping的核心理念是"等待"，Traffic Policing的核心理念是"丢弃"。它们是两种常见的流速控制方法

漏斗在一定程度上代表服务器的处理能力,请求根据先进先出(FIFO)调度算法等待处理,若倒入的水的速度小于漏水的速度，可以理解为服务器能够处理完所有的请求，此时整体服务表现正常。如果倒入水的速度大于漏水的速度，那么水桶内的水会不断增加直到最后溢出，这种情况下在水桶中的水可以理解为在队列中等待的请求，而溢出的水则表示直接被丢弃不处理的请求。

2. limit_req_zone 指令

bash 复制代码

Syntax:  limit_req_zone key zone=name:size rate=rate;
Context: http
Defaule: -

说明:

key: 使用nginx内置变量作为键,用于限制请求的变量,可以使用 $binary_remote_addr,它的特点是使用二进制来表示IP地址,如1.1.1.1这个ip在$ remote_addr中显示为1.1.1.1, $binary_remote_addr表示为二进制形式,因此$ binary_remote_addr占用的空间要比 $remote_addr更少.使用$ binary_remote_addr意味着将每个唯一的用户ip作为心智速率的判断依据.

zone: 定义用于存储前面定义的key变量和限制其访问请求频率tate变量的共享内存空间,将信息保存在共享内存中的好处是能够在多个worker进程中共享。存储空间的定义由两个部分组成：zone=后面的名称以及冒号后面的大小，如zone=mylimit:10m 就是一个名为mylimit的大小为10m的共享内存空间。以$binary_remote_addr 变量为例，它使用4 bytes来存储IPv4 地址或者是使用16 bytes来存储IPv6地址。存储状态始终在32位平台上占用64个字节，并在64位平台上占用128个字节。考虑到现在的服务器绝大多数都是64位的操作系统，1M的大小可以保留大约8192个128字节的状态。

当存储空间耗尽的时候，如果需要记录新的值，那么就会通过LRU算法 移除旧的变量来腾出空间，如果这样腾出来的空间还是不足以接纳新的记录值，那么nginx就会返回状态码503 (Service Temporarily Unavailable)。此外，为了防止内存耗尽，nginx每次创建一个新记录值的时候就会清理掉两个60秒内没被使用过的旧记录值。

rate: 设定允许的最大请求速率。nginx实现的是毫秒级别的控制粒度，10r/s对应的就是1r/100ms，这也就意味着在没有设置bursts的情况下，如果一个请求接受处理之后的100ms内出现第二个请求，那么它就会被拒绝处理。

limit_req_zone指令设置了速率限制和共享内存区域的参数，但它实际上并不限制请求速率。因此我们需要通过在contexts中使用limit_req指令来将其限制应用于特定location或server块。在上面的例子里，我们将请求速率限制在/login/这个location块中。因此现在每个唯一的 IP 地址被限制为每秒 10 个**/login/**请求，或者更准确地说，不能在前一个 URL 请求的 100 毫秒内发出对该 URL 的第二次请求

实例:

bash 复制代码

limit_req_zone $binary_remote_addr zone=cehis:10m rate=3r/s;
 
server {
    location /login/ {
        limit_req zone=ceshi;
        
        proxy_pass http://my_upstream;
    }
}

说明: 使用了limit_req_zone指令定义了一个限速zone,名为ceshi,大小为10m,对应的变量是$binary_remote_addr,限制的请求速率是每秒限制3个请求（3requests/secends），在login这个location中使用limit_req指定了限制的zone。

3. limit_req 指令

bash 复制代码

Syntax: limit_req zone=name [burst=number] [nodelay];
Context: http,server,location

**功能:**设置使用哪个共享内存限制域和允许被处理的最大请求数阀值。如果请求的频率超过了限制域配置的值，请求处理会被延迟，所以所有的请求都是以定义的频率被处理的。超过频率限制的请求会被延迟，直到被延迟的请求数超过了定义的阀值，这时，这个请求会被终止，并返回503（Service Tempporarily Unavailable）错误，这个阀值的默认值为0

说明:

burst: 可选项。后面接整数，表示最大允许超过频率限制的请求数（这个配置的意思是设置一个大小为number的缓冲区，当有大量请求（爆发）过来时，超过了访问频次限制的请求可以先放到这个缓冲区内等待，但是这个等待区里的位置只有number个，超过的请求会直接报503的错误然后返回。）
**nodelay:**可选项。如果不希望超过的请求被延迟，可以使用 nodelay 参数（如果设置，会在瞬时提供处理(burst + rate)个请求的能力，请求超过（burst + rate）的时候就会直接返回503，永远不存在请求需要等待的情况；如果没有设置，则所有请求会依次等待排队）

例子:

bash 复制代码

limit_req_zone $binary_remote_addr zone=ceshi:10m rate=10r/m;

bash 复制代码

limit_req zone=ceshi;
#不加burst和不加nodelay

**说明:**定义的名为ceshi的limit_req_zone（其定义的限制频率为每分钟的请求数为10个，即每6秒1次），假设同一客户端在同一时刻发起50个请求（前提这50个请求在服务器在6秒内收到），那么，服务器只会成功响应一次请求，对于其余49次请求服务器均不予响应并直接返回了503。

bash 复制代码

limit_req zone=ceshi burst=5;
#只加burst和不加nodelay

**说明:**定义的名为ceshi的limit_req_zone（其定义的限制频率为每分钟的请求数为10个，即每6秒1次），假设同一客户端在同一时刻发起50个请求，那么，服务器只会成功响应5+1=6次请求，但是这6次成功的请求会延时限制（其中第一次成功被服务器处理的请求是在6秒内，第二次是在大于6秒小于12秒内请求成功的，第三次则为大于十二秒小于十八秒内请求成功的，以此类推），对于其余44次请求服务器均不予响应并直接返回了503（这是因为设置了burst＝5，在服务器接收到50个并发请求后，先处理1个请求，同时将5个请求放入burst缓冲队列中，等待处理。而超过（burst+1）数量的请求就被直接抛弃了，即直接抛弃了44个请求)

bash 复制代码

limit_req zone=ceshi burst=5 nodelay;

**说明:**定义的名为ceshi的limit_req_zone（其定义的限制频率为每分钟的请求数为10个，即每6秒1次），假设同一客户端在同一时刻发起50个请求（前提这50个请求在服务器在30秒内收到），那么，服务器只会成功响应5+1=6次请求，但是没有时间的限制（即只要服务器处理速度够快，可以在1秒内处理完这6个请求），对于剩下的44个请求，直接返回503，在下一秒如果继续向服务端发送10个请求，服务端会直接拒绝这10个请求并返回503。因为设定了每6s处理1个请求，所以直到30s之后，才可以再处理一个请求，即如果此时向服务端发送10个请求，会返回9个503，一个200

示例

bash 复制代码

limit_req_zone $binary_remote_addr zone=ceshi:10m rate=5r/s;

server {
    listen 80;
    location / {
        limit_req zone=ceshi burst=12 delay=8;
        proxy_pass http://upstream;
    }
}

**说明:**这个示例是通过limit_req指令和delay参数来实现两段限速,delay参数将nginx配置为允许突发请求以适应典型的web浏览器请求模式,然后将额外的过度请求限制到一定程度,超过该点的额外过度请求将会被拒绝.

zone为ceshi的大小为10m,5r/s的限制速率一般来说网站通常每个页面有4到6个资源,并且永远不会超过12个资源,该配置允许最多12个请求的突发,其中前8个请求会被转发给upstream处理,在达到5r/s的请求限制之后,从第6个到13个请求会被添加到延迟(delay)中,在之后的任何请求都会被拒绝.