雪崩问题
data:image/s3,"s3://crabby-images/f57d5/f57d53e692cb2e77569e3e5472fe51dd5b48bb1b" alt=""
在单体项目里面,如果某一个模块出问题会导致整个项目都有问题。
在微服务项目里面,单独一个服务出问题理论上是不会影响别的服务的。 但是如果有别的业务需要调用这一个模块的话还是会有问题。
问题产生原因和解决思路
最初那只是一个小小的故障。后来随着调用的服务越来越多,然后等待时消耗完了系统资源,然后就集体蹦了。
data:image/s3,"s3://crabby-images/70adc/70adc8e0ab6ea9068cab088cfb3a44f4dab583f3" alt=""
data:image/s3,"s3://crabby-images/4d1c3/4d1c353ae610beb3679a38ae9f65fb16995133ba" alt=""
解决方案
高并发引发的问题可以通过限流解决.
请求限流用于避免服务故障。
data:image/s3,"s3://crabby-images/fe642/fe642efa3649cb770d2f959a449ef5d8686c8f20" alt=""
线程隔离用于避免故障扩散.限制了线程数之后这个服务就不会因为调用别的服务导致自身资源消耗殆尽。
为了防止线程资源一直被占用,这里还要做一个服务熔断,让出线程给别的服务。
发生熔断时直接走提前编写的fallback逻辑。这个就是服务降级。舍弃一部分保证整个微服务群的健康。
data:image/s3,"s3://crabby-images/65c0e/65c0e6de078a5336c868ef36267abb08f606134d" alt=""
data:image/s3,"s3://crabby-images/a6405/a6405ab14a4cf6272897511371561695a6903dd1" alt=""
技术实现
data:image/s3,"s3://crabby-images/d3fba/d3fba62d6eca0199b18ac36d6ffde545e03e11d4" alt=""
Sentinel
初识sentinel
可以在控制台去配置限流规则,熔断规则等等。
data:image/s3,"s3://crabby-images/4bfd6/4bfd6bdc94e6ca447b3e3aba8d1dbb820a587ad5" alt=""
Sentinel 的使用可以分为两个部分:
-
核心库(Jar包):不依赖任何框架/库,能够运行于 Java 8 及以上的版本的运行时环境,同时对 Dubbo / Spring Cloud 等框架也有较好的支持。在项目中引入依赖即可实现服务限流、隔离、熔断等功能。
-
控制台(Dashboard):Dashboard 主要负责管理推送规则、监控、管理机器信息等。
利用给好的jar包,在命令行用如下命令启动
java
java -Dserver.port=8090 -Dcsp.sentinel.dashboard.server=localhost:8090 -Dproject.name=sentinel-dashboard -jar sentinel-dashboard.jar
访问http://localhost:8090页面,就可以看到sentinel的控制台了:
data:image/s3,"s3://crabby-images/81220/81220187dba2f5b39bf2ff60cd50ba6550bba781" alt=""
需要输入账号和密码,默认都是:sentinel
登录后,即可看到控制台,默认会监控sentinel-dashboard服务本身:
data:image/s3,"s3://crabby-images/0a6e8/0a6e855869be772aab8a3fb7c45a74f7b9cd796e" alt=""
微服务整合
data:image/s3,"s3://crabby-images/65943/659437495095fa625d374a62d1e907e6b776b290" alt=""
访问一次之后,就可以顺利被监控了。
data:image/s3,"s3://crabby-images/5619e/5619e6aa2288265a9a36f1f31440b2824e6156d6" alt=""
data:image/s3,"s3://crabby-images/30303/30303f9ec4b3c75e35d7384f0cd307212d4b1921" alt=""
docker部署
拉取镜像
java
docker pull docker.io/bladex/sentinel-dashboard
创建容器
java
docker run --name sentinel -d -p 8858:8858 -d 镜像id
然后剩下的就是改改ip+端口,都是和上面一样的使用方法。
这个东西应该就是让微服务自己把自己的状况快照发送到sentinel,然后由sentinel根据定义的规则决定是否限流熔断等等。不是由sentinel主动发起监控,不然云服务器里面的sentinel怎么可能监控的到我本地的运行项目。
tmd,搞错了。这个玩意没办法从云端监控我的本地项目,只有第一次是本地项目主动发起的。剩下的都是要由sentinel发起监控.
请求限流
data:image/s3,"s3://crabby-images/3e33f/3e33fc458c92467e0ccdea0b9e41386771a5c30a" alt=""
快速入门
data:image/s3,"s3://crabby-images/5596b/5596b293c8f0d20194cf02e3d2c25e43bcbf9313" alt=""
可以看见,设置每秒一条之后,多出的请求会被sentinel拦截。
data:image/s3,"s3://crabby-images/f56ed/f56ed9bab3a999ece0664d371f821e7687ff149b" alt=""
添加一个每秒10的阈值之后使用jmeter进行50条线程2s内跑完的任务进行压力测试。
结果无误,2s内只有20条请求正常响应,剩下的全都被异常处理了。
data:image/s3,"s3://crabby-images/89e96/89e96ecfecea16ba95cd92ab009db29e90cd5dc0" alt=""
data:image/s3,"s3://crabby-images/e41c5/e41c54a76d3f0929b3bfc69b18d2e5406ea6adc9" alt=""
流控模式
data:image/s3,"s3://crabby-images/5cbe6/5cbe6e9d86414e54392a1d348fb7494f9f3f8c57" alt=""
关联
关联模式:这个模式是在某两个业务差不多同时发生时,通过限流其中一个业务的方式为另一个业务让行。
data:image/s3,"s3://crabby-images/1e901/1e9019a7efe46ab979701813122d23b14b7962aa" alt=""
然后给query加流控规则,当update1s超过5个请求时对query限流。
data:image/s3,"s3://crabby-images/37e33/37e33d8f27a402d04f4be9289228bfa7cacaaf7e" alt=""
jmeter测试,1000个线程100s执行完,也就是每秒10个请求. 可以的看见query被限流了。
data:image/s3,"s3://crabby-images/b0cf3/b0cf329bce0521a0eca47cc3e63d65740bdf4529" alt=""
data:image/s3,"s3://crabby-images/57329/57329be1950e79d2194b8986ec34be56f6390d16" alt=""
链路
data:image/s3,"s3://crabby-images/f7b2d/f7b2d53930adaa6944b16d2ca35ed199cca61e6c" alt=""
data:image/s3,"s3://crabby-images/ef9bf/ef9bf35a37330b47922558f9081a2a143b929dc6" alt=""
sentinel默认只会监控controller的资源,所以要用到sentinel的注解。
链路模式中,是对不同来源的两个链路做监控。但是sentinel默认会给进入SpringMVC的所有请求设置同一个root资源,会导致链路模式失效。
data:image/s3,"s3://crabby-images/a112d/a112d6f351efe33ac70dd9111112c355843ca8eb" alt=""
重新配置之后可以看见,service层的资源也被监控了。为其中一个goods设置流控。
data:image/s3,"s3://crabby-images/0d2c2/0d2c236a065b14a74e096e2f6747e7fc3bb6f28c" alt=""
data:image/s3,"s3://crabby-images/6e913/6e9132fcf64befaa948bc38a677d0e8c2d5ba457" alt=""
流控效果
data:image/s3,"s3://crabby-images/fd956/fd956ad0ceadf65c8543e5131b0d3cdf1f8cf941" alt=""
warm up
data:image/s3,"s3://crabby-images/913a0/913a0e832bfd527dc4f1169b438177a52d64c3ff" alt=""
data:image/s3,"s3://crabby-images/f3bf8/f3bf8ad18d22b500caf0c57dcc2b955fd725a0c1" alt=""
使用jmeter进行200个线程20s的压测,初始时成功的只有3个,说明初始阈值就是3,20s里后面每一秒内能通过的线程数也是组件上升。
data:image/s3,"s3://crabby-images/321e3/321e32bd5c88744b37618526a5886b992ce8bafb" alt=""
排队等待
data:image/s3,"s3://crabby-images/b4d48/b4d48f8e8ac24b29bda48396d3f99fdd54bdf936" alt=""
data:image/s3,"s3://crabby-images/a0672/a0672479d638b49aaecea168822e9e46555c4830" alt=""
使用jemter进行300个线程20s执行完的压测,qps是15.可以看见,后面大多数请求的响应时间都是接近5s了。这里起到了一个流量整形的作用。
data:image/s3,"s3://crabby-images/adbe4/adbe4b22ee36a84547d5a559570273bc4254a58a" alt=""
data:image/s3,"s3://crabby-images/9fb75/9fb752a23e92a7d48efbcb5dd5648615fc5c4532" alt=""
热点参限流
data:image/s3,"s3://crabby-images/34392/343921baf09463998b0cd3f291c29eda64995e0c" alt=""
只有那些通过@SentinelResource注解配置的资源才有效。
data:image/s3,"s3://crabby-images/f3e10/f3e10bd4662d744fd49e3f152d48225acaf93403" alt=""
所以要现在controller的资源上面添加注解。
data:image/s3,"s3://crabby-images/e9ed8/e9ed85587c9bdd65551458496b27228865eeafc4" alt=""
重启后可以看见hot的簇点链路。
在左侧的热点规则那里进行配置才会有高级选项.然后如下配置
使用jmeter发起3个500线程100s的请求,分别对应三种参数,qps为5.
然后结果如下,jmeter中101的是每秒2个成功,102是每秒4个,103是全部。
data:image/s3,"s3://crabby-images/5e8f6/5e8f68c68329cac53f3dd6545875b3f05e8de497" alt=""
隔离和降级
data:image/s3,"s3://crabby-images/b9595/b9595b2df43b6671031a89d1d8b3256b28216a53" alt=""
FeginClient整合Sentinel
例如在查询订单的时候,会发起远程调用去查询用户信息。这里就可以编写调用失败后的降级逻辑。
data:image/s3,"s3://crabby-images/8ad14/8ad14d2eba9e9043cae6f55c22ac5ce270975bcf" alt=""
data:image/s3,"s3://crabby-images/c1bf9/c1bf9312feaf73b06d867afa56c92e43577e68bd" alt=""
data:image/s3,"s3://crabby-images/5fe5c/5fe5ca8d3f48557ee489c062bbbd3036cba9981e" alt=""
这里启动时会有一个循环依赖的错误。
这里要在order-service服务里面自动注入UserClient时加上@Lazy注解。
或者是在启动类里添加@ComponentScan来扫描feign的包.两个方法都可以
java
@Autowired
@Lazy
private UserClient userClient;
这里运行时也还是会有循环依赖的报错.要将父工程里面的springcloud版本号改成SR8。这次才是真正解决问题.加上@Lazy只是延迟问题发生的时机。
这次在service层的hot下终于可以看见利用feign发起远程调用的接口了。
data:image/s3,"s3://crabby-images/98825/98825dec895d41c3b33f568ba5e3a4ede786ce53" alt=""
data:image/s3,"s3://crabby-images/8685d/8685de5d7040ff20576345a54d4791f511499e0f" alt=""
线程隔离(舱壁模式)
data:image/s3,"s3://crabby-images/00e8b/00e8b59ae5b7c9c6a3e33d58b026e475038e9bb6" alt=""
低扇出就是这个服务需要调用的服务较少。
线程池的做法是会开启独立线程的,而信号量的做法则不会。
data:image/s3,"s3://crabby-images/682b5/682b5e3f3bcf615e27a93134a2aa032f42874f73" alt=""
在jmeter中开启10个线程要求0s内完成。理论上是由8个线程会被拒绝的.
但是因为前面做了降级处理,会返回一个空对象而不是报错所以在控制台才可以看见报错的日志信息。不多不少,正好8个.
data:image/s3,"s3://crabby-images/19842/198421696c17dfb3dee64bc1076bdb4385a56184" alt=""
data:image/s3,"s3://crabby-images/d7538/d7538ab01ff09c8ffef4fae2cf2695b9f7d59a2e" alt=""
熔断降级
下面是sentinel断路器的三个状态和状态之间的切换。需要配置的两个重要参数有,熔断持续时间和熔断的阈值。
data:image/s3,"s3://crabby-images/8a616/8a61610b674a4015d0229cca8fa29bb1d98c0456" alt=""
慢调用
data:image/s3,"s3://crabby-images/1d9e1/1d9e1651c39d61158a6d2ad72972e15a8c2aaf57" alt=""
data:image/s3,"s3://crabby-images/a2b94/a2b947516c416eef85463234603679d6ee4373ab" alt=""
data:image/s3,"s3://crabby-images/43729/4372920d6c20cee8a275bcb9437ab833f9a10ea1" alt=""
发生熔断之后成功阻塞了这个接口。
异常比例、异常数
授权规则
data:image/s3,"s3://crabby-images/920b6/920b63554534094735df7eeb989566668b55879c" alt=""
data:image/s3,"s3://crabby-images/9aa3e/9aa3e0bd2adc0344441e968223c22142a20909de" alt=""
测试,然后尝试直接访问order-service时就会报错.
data:image/s3,"s3://crabby-images/54e75/54e75f51708b336b424334c2c7351a2548fef7b8" alt=""
然后通过gateway网关访问就可以正常访问
data:image/s3,"s3://crabby-images/90d82/90d8227b6aafc5e8f3e44760c1477fef078f36cb" alt=""
自定义异常结果
修改返回的限流异常为授权拦截.
通过实现下面的接口将所有不同类型的异常分别处理。
data:image/s3,"s3://crabby-images/07620/076200455b55fa77c99a6a8167af1b940b9b3ba1" alt=""
data:image/s3,"s3://crabby-images/19e48/19e4831d22f83aefc37986505ed7b7ad25f52f42" alt=""
data:image/s3,"s3://crabby-images/021cb/021cb5f2f9d54e37a45f6ea534a322d5970cda96" alt=""
java
@Component
public class SentinelExceptionHandler implements BlockExceptionHandler {
@Override
public void handle(HttpServletRequest request, HttpServletResponse response, BlockException e) throws Exception {
String msg = "未知异常";
int status = 429;
if (e instanceof FlowException) {
msg = "请求被限流了";
} else if (e instanceof ParamFlowException) {
msg = "请求被热点参数限流";
} else if (e instanceof DegradeException) {
msg = "请求被降级了";
} else if (e instanceof AuthorityException) {
msg = "没有权限访问";
status = 401;
}
response.setContentType("application/json;charset=utf-8");
response.setStatus(status);
response.getWriter().println("{\"msg\": " + msg + ", \"status\": " + status + "}");
}
}
规则持久化
sentinel把规则保存在内存里,重启就会自动丢失。
规则管理模式
data:image/s3,"s3://crabby-images/6772c/6772c8645d9944df2dce042a75ac4a5b11afe1a5" alt=""
data:image/s3,"s3://crabby-images/e33f5/e33f58695c89f01b8c05dd60c0d5eb49a9d0d17f" alt=""
data:image/s3,"s3://crabby-images/d7997/d7997d4125dc4a9bae3d75b3396573e1f83ebcf0" alt=""
data:image/s3,"s3://crabby-images/03f14/03f147c7497a61a1cd25931ef6158b40c91fdd26" alt=""
实现push模式
一、修改order-service服务
1.引入依赖
在order-service中引入sentinel监听nacos的依赖:
java
<dependency>
<groupId>com.alibaba.csp</groupId>
<artifactId>sentinel-datasource-nacos</artifactId>
</dependency>
2.配置nacos地址
在order-service中的application.yml文件配置nacos地址及监听的配置信息:
XML
spring:
cloud:
sentinel:
datasource:
flow:
nacos:
server-addr: localhost:8848 # nacos地址
dataId: orderservice-flow-rules
groupId: SENTINEL_GROUP
rule-type: flow # 还可以是:degrade、authority、param-flow
flow是持久化的,defrade是降级的
二、修改sentinel-dashboard源码
SentinelDashboard默认不支持nacos的持久化,需要修改源码。
tmd,看着教程巨几把麻烦,以后用服务器厂商提供的应该也不用我来搞这些,就不做了,以后有需求再来看吧.
可以看见最后实现效果如下,在指定页面添加的规则就会自动持久化到nacos.
data:image/s3,"s3://crabby-images/b6298/b6298763ac463aa429989e302d907467ea93737f" alt=""