降级方案以及实践

1: 降级的理解

降级其实就是能过就将就的过，能用将就的用，相比熔断来说，没有这么暴力，直接，比如之前公司的首页app首页，主要面对C端用户的，获取首页配置的qps非常的高，即使做了redis缓存，但是为了不影响用户的体验，我们也是做了降级操作，当redis出了问题，本地缓存有一个默认的配置，此时会降级读取本地缓存配置，这是非常经典的降级方案。

2: 降级的常用方案

2.1 跨服务降级

一台机器上部署了多个服务，此时流量高峰期，可能其它并不重要的服务会占用过多的机器资源，此时可能会关闭一些服务，将更多的机器资源腾出来给更重要的服务，怎么去衡量一个服务是否是更重要的呢？那就是赚钱能力。

2.1.1 跨服务降级常见操作

(1): 关闭不重要的服务节点

(2): 关闭部分节点

(3): 当客户端请求慢的时候，客户端可以不请求，直接默认返回即可，快速响应

2.2 本地提供有损服务

当面对业务高峰期的时候，比如一个用户需要去获取自定义的配置信息，但是当前业务高峰期，可能请求响应会存在慢，或者超时失败的请求，这个时候，可以提前拿本地配置响应给用户，快速先满足用户的需求。

2.2.1 本地提供有损服务

(1): 返回默认值，这算是最简单的一种状况。

(2): 将同步的请求转换为异步，将慢的步骤，能异步就异步

(3): 简化业务流程，关闭一些不重要的步骤，快速响应接口

3: 降级的工作实践

3.1: 扫描箱子的场景

3.1.1: 背景

背景是业务在操作的时候，会去扫描一个箱子，这个箱子状态是基础数据需要维护的,正常场景来说，如果基础数据服务稳定的话，更新状态都是同步的，为了面对异常情况，比如基础数据服务挂了，不能对外提供服务了，此时如果我们服务还是正常去请求，肯定会阻断现场业务操作，会被投诉的，所以我们对扫箱子的业务进行改造

3.1.2: 改造点

1：统计基础服务的异常频率，这个可以动态设置的，比如apollo, nacos等，比如 20次/分, 一分钟超过20次就会熔断触发服务降级。

2：更新箱子的状态操作，从之前的同步改造成异步执行，我们会将请求的元数据信息保存到数据库中，定时任务去捞取数据，进行异步调用。

3.2: 获取分箱配置

3.2.1: 背景

背景是箱子里面装了很多不同品类，或者标签的商品，后续箱子需要进行分箱的操作，会获取分箱的配置，然后根据这个配置进行按品类，按品质去进行分箱，这个配置同样的是请求基础数据服务的，基础数据服务挂了，就会获取不到的话，可能就会阻断现场操作

3.2.2: 改造点

(1): 当基础数据服务挂了，获取不到配置的时候，就默认取本地缓存配置(写死在配置里面的)，触发兜底策略