Nginx: 负载均衡场景下上游服务器异常时的容错机制

容错机制

  • 当负载均衡网络上的应用程序服务器,由于内部的某一些原因或者是网络原因导致的
  • 请求迟迟没有处理完,那这个时候我们是否可以做一些容错措施
  • 比如说可以将这个失败的请求继续由Nginx转发给另外一台服务器
  • 如果说有了这样一些容错机制的话,也是大大提高了我们整个系统的一个健壮性
  • 在反向代理场景中也有一些指令,用来定义这样一些功能的

1 )proxy_next_upstream 指令

  • 语法:proxy_next_upstream error| timeout | invalid_header | http_500 | http_502 | http_503 | http_504 | http_403 | http_404 | http_429 | noidempotent | off

  • 默认值: proxy_next_upstream error timeout;

  • 上下文:http、server、location

  • 可选值如下

    可选参数 含义
    error 向上游服务器传输请求或读取响应头发生错误
    timeout 向上游服务器传输请求或读取响应头发生超时
    invalid header 上游服务器返回无效的响应
    http_500 HTTP响应状态码为500时
    http_502 HTTP响应状态码为502时
    http_503 HTTP响应状态码为503时
    http_504 HTTP响应状态码为504时
    http_403 HTTP响应状态码为403时
    http_404 HTTP响应状态码为404时
    http_429 HTTP响应状态码为429时
    non_idempotent 非幂等请求失败时是否需要转发下一台上游服务器
    off 禁用请求失败转发功能,上游返回啥,nginx 返回啥给客户端
  • 所谓幂等的请求, 是指这个请求发出去之后,无论请求多少次,得到的结果通常是一致的

  • 非幂等与之相反,请求发出去后,可能在服务器上每次都会引起不同的结果

  • Post请求,它就是一个非幂等的 http 请求方法,因为可能会在后端服务器上创建一些资源

  • 非幂等请求,可能对服务器造成不可预见的一些错误,在某些场景下是很危险的

    • 比如说,一个支付性的网站,充值,支付的动作
    • 可能由于内部一些原因没有及时将响应返回给Nginx
    • Nginx 在一定的时间内,他会将这个请求再次转发给下一台应用服务器
    • 这个时候,又执行了一次充值动作,从而造成了这种重复充值
    • 所以说,在某些场景下,proxy_next_upstream 功能是比较危险的
    • 可能会造成一些意想不到的后果,所以这个 non_idempotent
    • 就是用来决定是不是需要开启针对这些非幂等的HTTP请求方法是否转发
  • 关于上面的off

    • 默认情况下一台服务器挂掉,nginx不会再给它转发
    • 如果设置了 off, 则可能会出现访问不通 502 的问题

2 )proxy_next_upstream_timeout 指令

  • 某一应用程序服务器未响应的超时时间
  • 语法: proxy_next_upstream_timeout times;
  • 默认值:proxy_next_upstream_timeout 0;
    • 0 表示可以无限制的等待
  • 上下文:http、server、location
  • 这种,如果有三台都不行,都每个重试一遍肯定是问题,看下面指令

3 )proxy_next_upstream_tries 指令

  • 某一应用程序服务器未响应尝试转发几次
  • 语法: proxy_next_upstream_tries number;
  • 默认值:proxy_next_upstream_tries 0;
    • 0 不限制转发几次
  • 上下文:http、server、location

4 )proxy_intercept_errors 指令

  • 上游返回响应码大于300时,是直接将上游响应返回客户端还是按照 error_page 处理
  • 这个不同于错误之后将请求分发给其他应用服务了
  • 语法:proxy_intercept_errors on | off ;
  • 默认值:proxy_intercept_errors on;
  • 上下文:http、server、location

5 )配置测试

5.1 上游应用服务器 (使用Nginx模拟)

conf 复制代码
server {
	listen 	4040;
	location / {
		return 200 'Return Result For Server 4040\n';
	}
}

server {
	listen  4050;
	location / {
		return 503 'Return Result For Server 4050\n';
	}
}

5.2 Nginx 代理服务器

conf 复制代码
upstream test_tolerant_server {
	server 192.168.184.20:4040;
	server 192.168.184.20:4050;
}

server {
	listen 	    80;
	root 		    /opt/nginx/html;
	
	location   /503.html {
	}
	
	location /test/ {
		proxy_pass http://test_tolerant_server;
		# proxy_next_upstream http_503;
		error_page 503 /503.html;
		proxy_intercept_errors on;
		# proxy_read_timeout 5;
	}
}
  • $touch /opt/nginx/html/503.html

    html 复制代码
    test 503 page
  • 基于以上可自行设置,测试,不再赘述

相关推荐
Arwen30320 分钟前
IP地址证书的常见问题有哪些?有没有特殊渠道可以申请免费IP证书?
服务器·网络·网络协议·tcp/ip·http·https
我命由我123452 小时前
充血模型与贫血模型
java·服务器·后端·学习·架构·java-ee·系统架构
米高梅狮子3 小时前
02. 配置DNS服务器
运维·服务器·centos
宴之敖者、3 小时前
Linux——指令
linux·运维·服务器
Xの哲學4 小时前
Linux设备驱动模型深度解剖: 从设计哲学到实战演练
linux·服务器·网络·算法·边缘计算
半夏知半秋4 小时前
kcp学习-通用的kcp lua绑定
服务器·开发语言·笔记·后端·学习
Ydwlcloud5 小时前
AWS 2026折扣活动深度解析:寻找最大优惠的智慧路径
大数据·服务器·人工智能·云计算·aws
松涛和鸣5 小时前
DAY55 Getting Started with ARM and IMX6ULL
linux·服务器·网络·arm开发·数据库·html
无线图像传输研究探索5 小时前
如何提升机器狗 “超视距” 作战能力?
服务器·网络·5g·机器人·无线图传·机器狗
成工小白6 小时前
网络复习(1)
服务器·网络·php