Nginx: 负载均衡场景下上游服务器异常时的容错机制

容错机制

  • 当负载均衡网络上的应用程序服务器,由于内部的某一些原因或者是网络原因导致的
  • 请求迟迟没有处理完,那这个时候我们是否可以做一些容错措施
  • 比如说可以将这个失败的请求继续由Nginx转发给另外一台服务器
  • 如果说有了这样一些容错机制的话,也是大大提高了我们整个系统的一个健壮性
  • 在反向代理场景中也有一些指令,用来定义这样一些功能的

1 )proxy_next_upstream 指令

  • 语法:proxy_next_upstream error| timeout | invalid_header | http_500 | http_502 | http_503 | http_504 | http_403 | http_404 | http_429 | noidempotent | off

  • 默认值: proxy_next_upstream error timeout;

  • 上下文:http、server、location

  • 可选值如下

    可选参数 含义
    error 向上游服务器传输请求或读取响应头发生错误
    timeout 向上游服务器传输请求或读取响应头发生超时
    invalid header 上游服务器返回无效的响应
    http_500 HTTP响应状态码为500时
    http_502 HTTP响应状态码为502时
    http_503 HTTP响应状态码为503时
    http_504 HTTP响应状态码为504时
    http_403 HTTP响应状态码为403时
    http_404 HTTP响应状态码为404时
    http_429 HTTP响应状态码为429时
    non_idempotent 非幂等请求失败时是否需要转发下一台上游服务器
    off 禁用请求失败转发功能,上游返回啥,nginx 返回啥给客户端
  • 所谓幂等的请求, 是指这个请求发出去之后,无论请求多少次,得到的结果通常是一致的

  • 非幂等与之相反,请求发出去后,可能在服务器上每次都会引起不同的结果

  • Post请求,它就是一个非幂等的 http 请求方法,因为可能会在后端服务器上创建一些资源

  • 非幂等请求,可能对服务器造成不可预见的一些错误,在某些场景下是很危险的

    • 比如说,一个支付性的网站,充值,支付的动作
    • 可能由于内部一些原因没有及时将响应返回给Nginx
    • Nginx 在一定的时间内,他会将这个请求再次转发给下一台应用服务器
    • 这个时候,又执行了一次充值动作,从而造成了这种重复充值
    • 所以说,在某些场景下,proxy_next_upstream 功能是比较危险的
    • 可能会造成一些意想不到的后果,所以这个 non_idempotent
    • 就是用来决定是不是需要开启针对这些非幂等的HTTP请求方法是否转发
  • 关于上面的off

    • 默认情况下一台服务器挂掉,nginx不会再给它转发
    • 如果设置了 off, 则可能会出现访问不通 502 的问题

2 )proxy_next_upstream_timeout 指令

  • 某一应用程序服务器未响应的超时时间
  • 语法: proxy_next_upstream_timeout times;
  • 默认值:proxy_next_upstream_timeout 0;
    • 0 表示可以无限制的等待
  • 上下文:http、server、location
  • 这种,如果有三台都不行,都每个重试一遍肯定是问题,看下面指令

3 )proxy_next_upstream_tries 指令

  • 某一应用程序服务器未响应尝试转发几次
  • 语法: proxy_next_upstream_tries number;
  • 默认值:proxy_next_upstream_tries 0;
    • 0 不限制转发几次
  • 上下文:http、server、location

4 )proxy_intercept_errors 指令

  • 上游返回响应码大于300时,是直接将上游响应返回客户端还是按照 error_page 处理
  • 这个不同于错误之后将请求分发给其他应用服务了
  • 语法:proxy_intercept_errors on | off ;
  • 默认值:proxy_intercept_errors on;
  • 上下文:http、server、location

5 )配置测试

5.1 上游应用服务器 (使用Nginx模拟)

conf 复制代码
server {
	listen 	4040;
	location / {
		return 200 'Return Result For Server 4040\n';
	}
}

server {
	listen  4050;
	location / {
		return 503 'Return Result For Server 4050\n';
	}
}

5.2 Nginx 代理服务器

conf 复制代码
upstream test_tolerant_server {
	server 192.168.184.20:4040;
	server 192.168.184.20:4050;
}

server {
	listen 	    80;
	root 		    /opt/nginx/html;
	
	location   /503.html {
	}
	
	location /test/ {
		proxy_pass http://test_tolerant_server;
		# proxy_next_upstream http_503;
		error_page 503 /503.html;
		proxy_intercept_errors on;
		# proxy_read_timeout 5;
	}
}
  • $touch /opt/nginx/html/503.html

    html 复制代码
    test 503 page
  • 基于以上可自行设置,测试,不再赘述

相关推荐
xdscode3 小时前
Linux云服务器安装openclaw,并对接飞书通道
linux·服务器·飞书·openclaw
lswzw3 小时前
win11家庭版 安装 openclaw
服务器
LegendNoTitle4 小时前
计算机三级等级考试 网络技术 选择题考点详细梳理
服务器·前端·经验分享·笔记·php
2401_877274244 小时前
从匿名管道到 Master-Slave 进程池:Linux 进程间通信深度实践
linux·服务器·c++
feng_you_ying_li4 小时前
linux之用户的权限详解(4)
linux·运维·服务器
二进制person5 小时前
JavaEE初阶 --网络编程
linux·服务器·网络
Irissgwe6 小时前
进程间通信
linux·服务器·网络·c++·进程间通信
创世宇图7 小时前
阿里云Alibaba Cloud Linux 4 LTS 64位生产环境配置-Nginx
linux·nginx
岁岁种桃花儿7 小时前
AI超级智能开发系列从入门到上天第四篇:AI应用方案设计
java·服务器·开发语言
TEC_INO8 小时前
嵌入式 Linux 开发知识总结
linux·运维·服务器