熔断与限流（上）

概念

熔断

在分布式系统中，服务与服务之间往往是相互依赖的，如果一个服务崩溃了，可能会影响到该服务所在的链路的其他服务，如果没有进行有效的隔离措施的话，可能会导致这个故障蔓延到整个系统，导致系统的雪崩

熔断则类似电力系统的保险丝，当电流过载时，就会触发保险丝的熔断机制，保护其他电路不受损害。

服务熔断是指当某个服务无法正常为服务调用者提供服务时，比如请求超时，服务异常等，为了防止整个系统出现雪崩效应，暂时将出现故障的接口隔离出来，断绝与外部接口的联系，当触发熔断之后，后续一段时间内该服务调用者的请求都会直接失败（无需等待到超时），直到目标服务恢复正常

熔断机制能够在服务故障时及时切断调用链，防止故障扩散，减少对故障服务的资源消耗，保护系统资源

不被耗尽，从而保护系统的整体稳定性和可用性。

限流

限流就是限制流量，在互联网应用中，限流可以确保服务器能够处理的请求数量在合理范围内，避免因请求过多导致服务响应慢或失败.可以保证用户在高流量时段仍然能够获得快速响应，提升用户体验。

本文将以sentinel实现限流与熔断的效果

Sentinel

在需要监控的服务添加下面的依赖：

xml 复制代码

<dependency>
    <groupId>com.alibaba.cloud</groupId>
    <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
</dependency>

xml 复制代码

spring:
  cloud:
    sentinel:
      transport:
        dashboard: 127.0.0.1:8080
        client-ip: 127.0.0.1 #连接本地Sentinel 可以不配置, 连接服务器Sentinel需要配置⼀下client-ip

当我们进行访问的时候可以在实时监控这个面板下看到当前QPS的通过数以及拒绝的数量

在簇点链路也可以看，簇点链路：是指在微服务架构中，请求从进入服务到处理完成所经过的完整调用链路，当请求进入服务时，首先会访问DispatcherServlet,然后进入Controller,Service,Mapper,这样的一个调用链就叫做簇点链路。

默认情况下，Sentinelstarter会为SpringMVC的所有HTTP服务提供限流埋点，所以如果只想对HTTP服务进行限流，那么只需要添加依赖即可，不需要修改任何代码，如果想要对特定的方法进行限流或者降级，则可以自定义资源来实现流控，熔断等都是针对簇点链路中的资源来设置的，因此我们可以点击对应资源后面的按钮来设置规则

限流设置

并发线程数限流用于保护业务线程数不被耗尽。例如，当应用所依赖的下游应用由于某种原因导致服务不稳定、响应延迟增加，对于调用者来说，意味着吞吐量下降和更多的线程数占用，极端情况下甚至导致线程池耗尽。为应对高线程占用的情况，业内有使用隔离的方案，比如通过不同业务逻辑使用不同线程池来隔离业务自身之间的资源争抢（线程池隔离），或者使用信号量来控制同时请求的个数（信号量隔离）。这种隔离方案虽然能够控制线程数量，但无法控制请求排队时间。当请求过多时排队也是无益的，直接拒绝能够迅速降低系统压力。Sentinel线程数限流不负责创建和管理线程池，而是简单统计当前请求上下文的线程个数，如果超出阈值，新的请求会被立即拒绝。

我们可以通过QPS来限制每秒最大请求量，在单机阈值填写对应的值即可。

高级设置------流控效果

流控效果：

快速失败：超过QPS的请求会直接响应失败

Warm Up:

Warm Up 也可以叫做预热模式，设置的单机阈值也是当前服务能承受的最大的QPS，该设置模式是当系统长期处于低水位的情况下，当流量突然增加的话，直接将系统接收最大的QPS，可能会导致系统崩溃，我们通过冷启动的方式，在指定的预热时长，让流量缓慢增加，最后达到最大的QPS，上面的预热时长设置为10，单机阈值为10，在10s的时间内将系统的QPS增加到10QPS

我们通过jmeter设置一下请求：线程数200，Ramp-Up时间10s，表示10s内发送200个请求，粗略估计QPS为20，然后我们通过同步定时器保证一下是20个请求同步发送，用户数20，表示等待20个线请求之后一起发送

我们可以看到QPS逐渐增加到10QPS

排队等待：

排队等待的方式控制了请求通过的间隔时间，让请求以均匀的速度通过，可以理解为将所有的请求放入到一个队列中，按照时间隔间通过对应的请求个数，后面的请求必须等待前面执行完成，直到超时。

高级设置------流控模式

直接：当流量超过设置的QPS，会对当前的接口限流，只要调用这个接口就会对这个接口进行限流，无论是谁调用。

链路：

我们先来构建链路：

java 复制代码

    @RequestMapping("/read/{productId}")
    public ProductInfo read(@PathVariable("productId") int productId) {
        return productService.selectProductById(productId);
    }

    @RequestMapping("/write/{productId}")
    public ProductInfo write(@PathVariable("productId") int productId) {
        return productService.selectProductById(productId);
    }

因为Sentinel默认是对HTTP请求进行监控，因此要监控到Service层的方法需要自定义sentinel资源，使用@SentinelResource

java 复制代码

@Service
public class ProductService {
    @Autowired
    private ProductMapper productMapper;

    @SentinelResource("selectProductById")
    public ProductInfo selectProductById(Integer id){
        return productMapper.selectProductById(id);
    }
}

链路模式中，是对不同来源的两个链路做监控，但是sentinel默认会给进入SpringMvC的所有请求设置同一个root资源，会导致链路模式失效.我们需要关闭这种对SpringMVC的资源聚合，修改配置如下：

对write资源进行限流，我们启动jmeter，设置QPS为20：

关联：

当两个资源之间具有资源争抢或者依赖关系的时候，这两个资源便具有了关联。比如对数据库同一个字段的读操作和写操作存在争抢，读的速度过高会影响写得速度，写的速度过高会影响读的速度。如果放任读写操作争抢资源，则争抢本身带来的开销会降低整体的吞吐量。可使用关联限流来避免具有关联关系的资源之间过度的争抢，举例来说，read_db 和 write_db 这两个资源分别代表数据库读写，我们可以给 read_db 设置限流规则来达到写优先的目的

介绍一下上面的配置：首先我们对read 资源进行限流，关联资源为write, 当write 的QPS超过设置的 5，触发限流，为保证write 正常运行，限制read ,优先处理 write 接口

这个限流规则的应用场景：在创建订单和读取订单信息中，如果流量过大，我们有限保证订单的创建，对读取订单这个资源进行限流。

热点参数限流

在微博热搜这种场景中，大量用户输入同一关键词，可能会导致服务的崩溃，为了避免这一情况的发生，我们可以针对参数进行限流。

单机阀值 ：对第一个参数的值进行统计，当相同值参数阈值超过5时，进行限流
参数例外项 ：针对一些特殊的参数，进行单独设置
参数类型 ：热点参数的类型，只支持int,double,String,long,float,char,byte
参数值 ：具体的参数值
限流阀值：对这个参数进行额外的阈值设置

设置后的效果图：

对于10010 进行了QPS = 5 的限流