雪崩问题及解决方案

一篇学习笔记,做一点简单的记录。

雪崩问题

我这里展示了一个微服务中服务调用的一个简单示例,在这个例子上来说一下雪崩问题

在上图中,现在的调用关系都还是正常的,也是我们所期望的样子,但是如果有服务出现故障无法返回结果,就可能发生雪崩问题。


那什么是雪崩问题呢?

微服务调用链中某个服务故障,引起整个链路中所有微服务都不可用,这就是雪崩。

我们来分析一下雪崩出现的原因:

在上图中,我们的所有调用关系都是正常的,服务发起的调用很快就能响应回来,但是如果上图中的服务B发生故障,无法向依赖它的服务D和服务C响应结果 ,那服务D和服务C发起这个调用的线程就会阻塞住(无法释放连接) ,这样的请求肯定不止一个,每次请求都会发生线程的阻塞,这样的线程会越来越多,他们占用着服务器的资源无法释放 ,最后就会导致服务D和服务C无法接受请求(连接资源被耗尽),这样的问题也会影响到依赖于D和服务C的其他服务

总结一下:

一个服务故障导致依赖于它的服务也出现故障,而在微服务中,这样的依赖关系可能会很复杂,受到影响的服务会非常多,这就是雪崩


解决雪崩问题的常见方法

  1. 超时处理

设定超时时间,请求超过一定时间没有响应就返回错误信息,不会无止休的等待。

样的方式可以缓解雪崩问题,但也会有一种情况,也就是请求发起的速度远高于它释放的时间,它可能还没来得急释放连接就资源就被占满了

2.舱壁模式

限定每个业务所能使用的线程数,避免耗尽整个服务器的资源,因此也叫线程隔离。

控制并发调用数,这样就算业务B的调用发生了故障也不会影响到整个服务,

虽然解决了雪崩问题,但是也会有资源的浪费,服务C已经故障了,但还是一直有请求访问

  1. 熔断降级
    断路器统计业务执行的异常比例,如果超出阈值则会熔断该业务,拦截访问该业务的一切请求。

断路器会统计服务A发生异常的请求(以请求服务D为例),如果异常的比例超过了阈值,这个时候就会出现熔断,这个时候服务A又来请求访问服务D,就会拦截这个请求,然后快速失败。

  1. 流量控制

限制业务访问的QPS,避免服务因流浪的突增而故障。

预防雪崩问题,避免服务出现故障,这样就不会出现故障传递,进而引起雪崩问题

相关推荐
uzong13 分钟前
面试官:如何做好架构设计
后端·架构
Cosolar29 分钟前
QwenPaw Agent 实现原理深度剖析
后端·面试·架构
Sincerelyplz1 小时前
【AI会议纪要实践】mapReduce、RAG 与结构化输出
java·后端·agent
zavoryn1 小时前
后端接入 AI Agent:Tool Calling 网关、幂等与审计日志实战
后端·架构
swipe2 小时前
混合检索 RAG 的工程化实践:不是多查几路,而是把召回、重排和上下文预算管好
后端·langchain·llm
uzong2 小时前
分布式下的系统,什么是算是好的架构设计
后端·架构
金銀銅鐵3 小时前
[Java] 如何理解 class 文件中方法的 access flags?
java·后端
夜微凉43 小时前
MySQL 事务 ACID
后端
狼爷3 小时前
百万QPS多场次秒杀系统架构全解:解耦设计、防超卖、流量防护体系
后端·架构
ruxingli4 小时前
Golang iota详解
开发语言·后端·golang