一、Sentinel简介

官方Github
官方文档

1、Sentinel 是什么?

随着微服务的流行,服务和服务之间的稳定性变得越来越重要。Sentinel 以流量为切入点,从流量控制、熔断降级、系统负载保护等多个维度保护服务的稳定性。
Sentinel 具有以下特征:

  • 丰富的应用场景:Sentinel 承接了阿里巴巴近 10 年的双十一大促流量的核心场景,例如秒杀(即突发流量控制在系统容量可以承受的范围)、消息削峰填谷、集群流量控制、实时熔断下游不可用应用等。
  • 完备的实时监控:Sentinel 同时提供实时的监控功能。您可以在控制台中看到接入应用的单台机器秒级数据,甚至 500 台以下规模的集群的汇总运行情况。
  • 广泛的开源生态:Sentinel 提供开箱即用的与其它开源框架/库的整合模块,例如与 Spring Cloud、Apache Dubbo、gRPC、Quarkus 的整合。您只需要引入相应的依赖并进行简单的配置即可快速地接入 Sentinel。同时 Sentinel 提供 Java/Go/C++ 等多语言的原生实现。
  • 完善的 SPI 扩展机制:Sentinel 提供简单易用、完善的 SPI 扩展接口。您可以通过实现扩展接口来快速地定制逻辑。例如定制规则管理、适配动态数据源等。

官网介绍

Hystrix与Sentinel比较:

  • Hystrix
    • 需要我们程序员自己手工搭建监控平台
    • 没有一套web界面可以给我们进行更加细粒度化得配置流控、速率控制、服务熔断、服务降级
  • Sentinel
    • 单独一个组件,可以独立出来。
    • 直接界面化的细粒度统一配置。

约定 > 配置 > 编码

2、Sentinel 去哪下?

https://github.com/alibaba/Sentinel/releasesimage.png

3、Sentinel 能干嘛?

Sentinel 的主要特性:
14 Sentinel实现熔断与限流 - 图3

4、Sentinel 怎么玩?

官方文档
服务使用中的各种问题

  • 服务雪崩
  • 服务降级
  • 服务熔断
  • 服务限流

二、安装Sentinel控制台

1、sentinel组件由2部分组成

  • 核心库(Java 客户端)不依赖任何框架/库,能够运行于所有 Java 运行时环境,同时对 Dubbo / Spring Cloud 等框架也有较好的支持。
  • 控制台(Dashboard)基于 Spring Boot 开发,打包后可以直接运行,不需要额外的 Tomcat 等应用容器。

2、安装步骤

下载

https://github.com/alibaba/Sentinel/releases
下载到本地sentinel-dashboard-1.7.0.jar

运行命令

前提

  • Java 8 环境
  • 8080端口不能被占用

    命令

  • java -jar sentinel-dashboard-1.7.0.jar

  • 访问Sentinel管理界面

访问sentinel管理界面

三、初始化演示工程

1、启动Nacos8848

http://localhost:8848/nacos/#/login

2、Module

新建工程 - cloudalibaba-sentinel-service8401

POM

  1. <dependencies>
  2. <dependency>
  3. <groupId>com.atguigu.springcloud</groupId>
  4. <artifactId>cloud-api-commons</artifactId>
  5. <version>${project.version}</version>
  6. </dependency>
  7. <dependency>
  8. <groupId>com.alibaba.cloud</groupId>
  9. <artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId>
  10. </dependency>
  11. <dependency>
  12. <groupId>com.alibaba.csp</groupId>
  13. <artifactId>sentinel-datasource-nacos</artifactId>
  14. </dependency>
  15. <dependency>
  16. <groupId>com.alibaba.cloud</groupId>
  17. <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
  18. </dependency>
  19. <dependency>
  20. <groupId>org.springframework.cloud</groupId>
  21. <artifactId>spring-cloud-starter-openfeign</artifactId>
  22. </dependency>
  23. <dependency>
  24. <groupId>org.springframework.boot</groupId>
  25. <artifactId>spring-boot-starter-web</artifactId>
  26. </dependency>
  27. <dependency>
  28. <groupId>org.springframework.boot</groupId>
  29. <artifactId>spring-boot-starter-actuator</artifactId>
  30. </dependency>
  31. <dependency>
  32. <groupId>org.springframework.boot</groupId>
  33. <artifactId>spring-boot-devtools</artifactId>
  34. <scope>runtime</scope>
  35. <optional>true</optional>
  36. </dependency>
  37. <dependency>
  38. <groupId>cn.hutool</groupId>
  39. <artifactId>hutool-all</artifactId>
  40. <version>4.6.3</version>
  41. </dependency>
  42. <dependency>
  43. <groupId>org.projectlombok</groupId>
  44. <artifactId>lombok</artifactId>
  45. <optional>true</optional>
  46. </dependency>
  47. <dependency>
  48. <groupId>org.springframework.boot</groupId>
  49. <artifactId>spring-boot-starter-test</artifactId>
  50. <scope>test</scope>
  51. </dependency>
  52. </dependencies>

YML

  1. server:
  2. port: 8401
  3. spring:
  4. application:
  5. name: cloudalibaba-sentinel-service
  6. cloud:
  7. nacos:
  8. discovery:
  9. server-addr: localhost:8848
  10. sentinel:
  11. transport:
  12. dashboard: localhost:8080
  13. port: 8719 #默认8719,假如被占用了会自动从8719开始依次+1扫描。直至找到未被占用的端口
  14. management:
  15. endpoints:
  16. web:
  17. exposure:
  18. include: '*'

主启动

  1. @EnableDiscoveryClient
  2. @SpringBootApplication
  3. public class MainApp8401 {
  4. public static void main(String[] args) {
  5. SpringApplication.run(MainApp8401.class, args);
  6. }
  7. }

业务类FlowLimitController

  1. @RestController
  2. public class FlowLimitController {
  3. @GetMapping("/testA")
  4. public String testA() {
  5. return "------testA";
  6. }
  7. @GetMapping("/testB")
  8. public String testB() {
  9. return "------testB";
  10. }
  11. }

3、启动Sentinel8080

Sentinel8080 - java -jar sentinel-dashboard-1.7.0.jar

4、启动微服务8401

启动8401微服务后查看sentienl控制台

刚启动,空空如也,啥都没有
image.png

Sentinel采用的懒加载说明

image.png

结论

sentinel8080正在监控微服务8401


四、流控规则

1、基本介绍image.png

进一步解释说明:

资源名:唯一名称,默认请求路径。 针对来源:Sentinel可以针对调用者进行限流,填写微服务名,默认default(不区分来源)。 阈值类型/单机阈值: QPS(每秒钟的请求数量)︰当调用该API的QPS达到阈值的时候,进行限流。 线程数:当调用该API的线程数达到阈值的时候,进行限流。 是否集群:不需要集群。 流控模式: 直接:API达到限流条件时,直接限流。 关联:当关联的资源达到阈值时,就限流自己。 链路:只记录指定链路上的流量(指定资源从入口资源进来的流量,如果达到阈值,就进行限流)【API级别的针对来源】。 流控效果: 快速失败:直接失败,抛异常。 Warm up:根据Code Factor(冷加载因子,默认3)的值,从阈值/codeFactor,经过预热时长,才达到设置的QPS阈值。 排队等待:匀速排队,让请求以匀速的速度通过,阈值类型必须设置为QPS,否则无效。

2、流控模式

2.1、直接(默认)

直接 -> 快速失败(系统默认)

配置及说明

表示1秒钟内查询1次就是OK,若超过次数1,就直接->快速失败,报默认错误
image.png

测试

快速多次点击访问http://localhost:8401/testA

结果

返回页面 Blocked by Sentinel (flow limiting)

思考

直接调用默认报错信息,技术方面OK,但是,是否应该有我们自己的后续处理?类似有个fallback的兜底方法?

2.2、关联

是什么?

  • 当自己关联的资源达到阈值时,就限流自己
  • 当与A关联的资源B达到阀值后,就限流A自己(B惹事,A挂了)

    设置testA

    当关联资源/testB的QPS阀值超过1时,就限流/testA的Rest访问地址,当关联资源到阈值后限制配置好的资源名。
    image.png

    Postman模拟并发密集访问testB

    访问testB成功image.png
    postman里新建多线程集合组,将访问地址添加进新新线程组image.png
    Run - 大批量线程高并发访问B
    image.png

    运行后发现testA挂了

  • 点击访问http://localhost:8401/testA

  • 结果Blocked by Sentinel(flow limiting)

2.3、链路

  • 多个请求调用了同一个微服务
  • 只记录指定链路上的流量(指定资源从入口资源进来的流量,如果达到阈值,就进行限流)【API级别的针对来源】

3、流控效果

流控效果只有QPS有,线程数没有。

3.1、直接->快速失败(默认的流控处理)

直接失败,抛出异常 Blocked by Sentinel (flow limiting)

3.2、预热

说明

公式:阈值除以coldFactor(默认值为3),经过预热时长后才会达到阈值

Warm Up

Warm Up(RuleConstant.CONTROL_BEHAVIOR_WARM_UP)方式,即预热/冷启动方式。当系统长期处于低水位的情况下,当流量突然增加时,直接把系统拉升到高水位可能瞬间把系统压垮。通过”冷启动”,让通过的流量缓慢增加,在一定时间内逐渐增加到阈值上限,给冷系统一个预热的时间,避免冷系统被压垮。详细文档可以参考流量控制限流 冷启动,具体的例子可以参见 WarmUpFlowDemo
通常冷启动的过程系统允许通过的 QPS 曲线如下图所示:
image.png

默认coldFactor为3,即请求QPS 从 threshold / 3开始,经预热时长逐渐升至设定的QPS阈值。

WarmUp配置

案例,阀值为10+预热时长设置5秒。
系统初始化的阀值为10/ 3约等于3,即阀值刚开始为3;然后过了5秒后阀值才慢慢升高恢复到10image.png

测试

多次快速点击http://localhost:8401/testB - 刚开始不行,后续慢慢OK

应用场景

如:秒杀系统在开启的瞬间,会有很多流量上来,很有可能把系统打死,预热方式就是把为了保护系统,可慢慢的把流量放进来,慢慢的把阀值增长到设置的阀值。

3.3、排队等待

匀速排队,让请求以均匀的速度通过,阀值类型必须设成QPS,否则无效。
设置:/testA每秒1次请求,超过的话就排队等待,等待的超时时间为20000毫秒。image.png

匀速排队

匀速排队(RuleConstant.CONTROL_BEHAVIOR_RATE_LIMITER)方式会严格控制请求通过的间隔时间,也即是让请求以均匀的速度通过,对应的是漏桶算法。详细文档可以参考 流量控制 - 匀速器模式,具体的例子可以参见 PaceFlowDemo
该方式的作用如下图所示:image.png这种方式主要用于处理间隔性突发的流量,例如消息队列。想象一下这样的场景,在某一秒有大量的请求到来,而接下来的几秒则处于空闲状态,我们希望系统能够在接下来的空闲期间逐渐处理这些请求,而不是在第一秒直接拒绝多余的请求。

注意:匀速排队模式暂时不支持 QPS > 1000 的场景。

测试

  • 添加日志记录代码到FlowLimitController的testA方法

    1. @RestController
    2. @Slf4j
    3. public class FlowLimitController {
    4. @GetMapping("/testA")
    5. public String testA() {
    6. log.info(Thread.currentThread().getName()+"\t"+"...testA");//<----
    7. return "------testA";
    8. }
    9. ...
    10. }
  • Postman模拟并发密集访问testA。

  • 后台结果image.png

五、降级规则

1、熔断降级概述

官方文档
除了流量控制以外,对调用链路中不稳定的资源进行熔断降级也是保障高可用的重要措施之一。一个服务常常会调用别的模块,可能是另外的一个远程服务、数据库,或者第三方 API 等。例如,支付的时候,可能需要远程调用银联提供的 API;查询某个商品的价格,可能需要进行数据库查询。然而,这个被依赖服务的稳定性是不能保证的。如果依赖的服务出现了不稳定的情况,请求的响应时间变长,那么调用服务的方法的响应时间也会变长,线程会产生堆积,最终可能耗尽业务自身的线程池,服务本身也变得不可用。
14 Sentinel实现熔断与限流 - 图17
现代微服务架构都是分布式的,由非常多的服务组成。不同服务之间相互调用,组成复杂的调用链路。以上的问题在链路调用中会产生放大的效果。复杂链路上的某一环不稳定,就可能会层层级联,最终导致整个链路都不可用。因此我们需要对不稳定的弱依赖服务调用进行熔断降级,暂时切断不稳定调用,避免局部不稳定因素导致整体的雪崩。熔断降级作为保护自身的手段,通常在客户端(调用端)进行配置。

2、基本介绍

image.png

  • RT(平均响应时间,秒级)
    • 平均响应时间 超出阈值 且 在时间窗口内通过的请求>=5,两个条件同时满足后触发降级。
    • 窗口期过后关闭断路器。
    • RT最大4900(更大的需要通过-Dcsp.sentinel.statistic.max.rt=XXXX才能生效)。
  • 异常比列(秒级)
    • QPS >= 5且异常比例(秒级统计)超过阈值时,触发降级;时间窗口结束后,关闭降级 。
  • 异常数(分钟级)
    • 异常数(分钟统计)超过阈值时,触发降级;时间窗口结束后,关闭降级

进一步说明

  • Sentinel熔断降级会在调用链路中某个资源出现不稳定状态时(例如调用超时或异常比例升高),对这个资源的调用进行限制,让请求快速失败,避免影响到其它的资源而导致级联错误。
  • 当资源被降级后,在接下来的降级时间窗口之内,对该资源的调用都自动熔断(默认行为是抛出 DegradeException)。

Sentinel的断路器是没有半开状态的

  • 半开的状态系统自动去检测是否请求有异常,没有异常就关闭断路器恢复使用,有异常则继续打开断路器不可用。
  • 具体可以参考Hystrix

image.pngimage.png

3、降级策略实战

3.1、RT

是什么?

平均响应时间(DEGRADE_GRADE_RT):当1s内持续进入5个请求,对应时刻的平均响应时间(秒级)均超过阈值( count,以ms为单位),那么在接下的时间窗口(DegradeRule中的timeWindow,以s为单位)之内,对这个方法的调用都会自动地熔断(抛出DegradeException )。注意Sentinel 默认统计的RT上限是4900 ms,超出此阈值的都会算作4900ms,若需要变更此上限可以通过启动配置项-Dcsp.sentinel.statistic.max.rt=xxx来配置。
image.png

测试

代码

  1. @RestController
  2. @Slf4j
  3. public class FlowLimitController {
  4. ...
  5. @GetMapping("/testD")
  6. public String testD() {
  7. try {
  8. TimeUnit.SECONDS.sleep(1);
  9. } catch (InterruptedException e) {
  10. e.printStackTrace();
  11. }
  12. log.info("testD 测试RT");
  13. }
  14. }

配置
image.png
postman压测
image.png
结论
按照上述配置,永远一秒钟打进来10个线程(大于5个了)调用testD,我们希望200毫秒处理完本次任务,如果超过200毫秒还没处理完,在未来1秒钟的时间窗口内,断路器打开(保险丝跳闸)微服务不可用,保险丝跳闸断电了后续我停止jmeter,没有这么大的访问量了,断路器关闭(保险丝恢复),微服务恢复OK。

3.2、异常比例

是什么?

异常比例(DEGRADE_GRADE_EXCEPTION_RATIO):当资源的每秒请求量 >= 5,并且每秒异常总数占通过量的比值超过阈值( DegradeRule中的 count)之后,资源进入降级状态,即在接下的时间窗口( DegradeRule中的timeWindow,以s为单位)之内,对这个方法的调用都会自动地返回。异常比率的阈值范围是[0.0, 1.0],代表0% -100%。
image.png

测试

代码

  1. @RestController
  2. @Slf4j
  3. public class FlowLimitController {
  4. ...
  5. @GetMapping("/testD")
  6. public String testD() {
  7. log.info("testD 异常比例");
  8. int age = 10/0;
  9. return "------testD";
  10. }
  11. }

配置
image.png
结论
按照上述配置,单独访问一次,必然来一次报错一次(int age = 10/0),调一次错一次。
直接高并发发送请求,多次调用达到我们的配置条件了。断路器开启(保险丝跳闸),微服务不可用了,不再报错error而是服务降级了。

3.3、异常数

是什么?

异常数( DEGRADE_GRADF_EXCEPTION_COUNT ):当资源近1分钟的异常数目超过阈值之后会进行熔断。注意由于统计时间窗口是分钟级别的,若timeWindow小于60s,则结束熔断状态后码可能再进入熔断状态。

异常数是按照分钟统计的,时间窗口一定要大于等于60秒
image.png

测试

代码

  1. @RestController
  2. @Slf4j
  3. public class FlowLimitController{
  4. ...
  5. @GetMapping("/testE")
  6. public String testE()
  7. {
  8. log.info("testE 测试异常数");
  9. int age = 10/0;
  10. return "------testE 测试异常数";
  11. }
  12. }

配置
image.png
访问http://localhost:8401/testE,第一次访问绝对报错,因为除数不能为零,我们看到error窗口,但是达到5次报错后,进入熔断后降级。

六、热点key限流

1、基本介绍

image.png

2、官网

官方文档

何为热点?热点即经常访问的数据。很多时候我们希望统计某个热点数据中访问频次最高的 Top K 数据,并对其访问进行限制。比如:

  • 商品 ID 为参数,统计一段时间内最常购买的商品 ID 并进行限制
  • 用户 ID 为参数,针对一段时间内频繁访问的用户 ID 进行限制

热点参数限流会统计传入参数中的热点参数,并根据配置的限流阈值与模式,对包含热点参数的资源调用进行限流。热点参数限流可以看做是一种特殊的流量控制,仅对包含热点参数的资源调用生效。 image.png Sentinel 利用 LRU 策略统计最近最常访问的热点参数,结合令牌桶算法来进行参数级别的流控。热点参数限流支持集群模式。

[

](https://blog.csdn.net/u011863024/article/details/114298288)

3、承上启下复习start

  • 兜底方法,分为系统默认和客户自定义,两种
  • 之前的case,限流出问题后,都是用sentinel系统默认的提示: Blocked by Sentinel (flow limiting)
  • 我们能不能自定?类似hystrix,某个方法出问题了,就找对应的兜底降级方法?
  • 结论 - 从HystrixCommand到@SentinelResource

4、代码

  1. @RestController
  2. @Slf4j
  3. public class FlowLimitController
  4. {
  5. ...
  6. @GetMapping("/testHotKey")
  7. @SentinelResource(value = "testHotKey",blockHandler/*兜底方法*/ = "deal_testHotKey")
  8. public String testHotKey(@RequestParam(value = "p1",required = false) String p1,
  9. @RequestParam(value = "p2",required = false) String p2) {
  10. //int age = 10/0;
  11. return "------testHotKey";
  12. }
  13. /*兜底方法*/
  14. public String deal_testHotKey (String p1, String p2, BlockException exception) {
  15. return "------deal_testHotKey,o(╥﹏╥)o"; //sentinel系统默认的提示:Blocked by Sentinel (flow limiting)
  16. }
  17. }

5、配置

image.png

  • @SentinelResource(value = “testHotKey”)

异常打到了前台用户界面看到,不友好

  • @SentinelResource(value = “testHotKey”, blockHandler = “dealHandler_testHotKey”)

方法testHotKey里面第一个参数只要QPS超过每秒1次,马上降级处理
异常用了我们自己定义的兜底方法

6、测试

  • error

http://localhost:8401/testHotKey?p1=abc
http://localhost:8401/testHotKey?p1=abc&p2=33

  • right

http://localhost:8401/testHotKey?p2=abc

7、参数例外项

  • 普通 - 超过1秒钟一个后,达到阈值1后马上被限流
  • 我们期望p1参数当它是某个特殊值时,它的限流值和平时不一样
  • 特例 - 假如当p1的值等于5时,它的阈值可以达到200

    配置

    image.png
    测试

  • right - http://localhost:8401/testHotKey?p1=5

  • error - http://localhost:8401/testHotKey?p1=3
  • 当p1等于5的时候,阈值变为200
  • 当p1不等于5的时候,阈值就是平常的1

前提条件 - 热点参数的注意点,参数必须是基本类型或者String

8、其它

在方法体抛异常

  1. @RestController
  2. @Slf4j
  3. public class FlowLimitController
  4. {
  5. ...
  6. @GetMapping("/testHotKey")
  7. @SentinelResource(value = "testHotKey",blockHandler/*兜底方法*/ = "deal_testHotKey")
  8. public String testHotKey(@RequestParam(value = "p1",required = false) String p1,
  9. @RequestParam(value = "p2",required = false) String p2) {
  10. int age = 10/0;//<----------------------------会抛异常的地方
  11. return "------testHotKey";
  12. }
  13. /*兜底方法*/
  14. public String deal_testHotKey (String p1, String p2, BlockException exception) {
  15. return "------deal_testHotKey,o(╥﹏╥)o"; //sentinel系统默认的提示:Blocked by Sentinel (flow limiting)
  16. }
  17. }

将会抛出Spring Boot 2的默认异常页面,而不是兜底方法。

  • @SentinelResource - 处理的是sentinel控制台配置的违规情况,有blockHandler方法配置的兜底处理;
  • RuntimeException int age = 10/0,这个是java运行时报出的运行时异常RunTimeException,@SentinelResource不管

总结 - @SentinelResource主管配置出错,运行出错该走异常走异常

七、系统规则

官方文档

Sentinel 系统自适应限流从整体维度对应用入口流量进行控制,结合应用的 Load、CPU 使用率、总体平均 RT、入口 QPS 和并发线程数等几个维度的监控指标,通过自适应的流控策略,让系统的入口流量和系统的负载达到一个平衡,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。

系统规则

系统保护规则是从应用级别的入口流量进行控制,从单台机器的 load、CPU 使用率、平均 RT、入口 QPS 和并发线程数等几个维度监控应用指标,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。
系统保护规则是应用整体维度的,而不是资源维度的,并且仅对入口流量生效。入口流量指的是进入应用的流量(EntryType.IN),比如 Web 服务或 Dubbo 服务端接收的请求,都属于入口流量。
系统规则支持以下的模式:

  • Load 自适应(仅对 Linux/Unix-like 机器生效):系统的 load1 作为启发指标,进行自适应系统保护。当系统 load1 超过设定的启发值,且系统当前的并发线程数超过估算的系统容量时才会触发系统保护(BBR 阶段)。系统容量由系统的 maxQps minRt 估算得出。设定参考值一般是 CPU cores 2.5。
  • CPU usage(1.5.0+ 版本):当系统 CPU 使用率超过阈值即触发系统保护(取值范围 0.0-1.0),比较灵敏。
  • 平均 RT:当单台机器上所有入口流量的平均 RT 达到阈值即触发系统保护,单位是毫秒。
  • 并发线程数:当单台机器上所有入口流量的并发线程数达到阈值即触发系统保护。
  • 入口 QPS:当单台机器上所有入口流量的 QPS 达到阈值即触发系统保护。

八、@SentinelResource

1、按资源名称限流 + 后续处理

启动Nacos成功
启动Sentinel成功
Module - cloudalibaba-sentinel-service8401

  1. @RestController
  2. public class RateLimitController {
  3. @GetMapping("/byResource")
  4. @SentinelResource(value = "byResource",blockHandler = "handleException")
  5. public CommonResult byResource() {
  6. return new CommonResult(200,"按资源名称限流测试OK",new Payment(2020L,"serial001"));
  7. }
  8. public CommonResult handleException(BlockException exception) {
  9. return new CommonResult(444,exception.getClass().getCanonicalName()+"\t 服务不可用");
  10. }
  11. }

配置流控规则

  1. 配置步骤

image.png

  1. 图形配置和代码关系

表示1秒钟内查询次数大于1,就跑到我们自定义的处流,限流
测试
1秒钟点击1下,OK
超过上述,疯狂点击,返回了自己定义的限流处理信息,限流发生

  1. {"code":444, "message":"com.alibaba.csp.sentinel.slots.block.flow.FlowException\t 服务不可用", "data":null}

额外问题
此时关闭问服务8401 -> Sentinel控制台,流控规则消失了

2、按照Url地址限流 + 后续处理

通过访问的URL来限流,会返回Sentinel自带默认的限流处理信息
业务类RateLimitController

  1. @RestController
  2. public class RateLimitController
  3. {
  4. ...
  5. @GetMapping("/rateLimit/byUrl")
  6. @SentinelResource(value = "byUrl")
  7. public CommonResult byUrl()
  8. {
  9. return new CommonResult(200,"按url限流测试OK",new Payment(2020L,"serial002"));
  10. }
  11. }

Sentinel控制台配置
image.png
测试

上面兜底方案面临的问题

  1. 系统默认的,没有体现我们自己的业务要求。
  2. 依照现有条件,我们自定义的处理方法又和业务代码耦合在一块,不直观。
  3. 每个业务方法都添加—个兜底的,那代码膨胀加剧。
  4. 全局统—的处理方法没有体现。

3、客户自定义限流处理逻辑

自定义限流处理类 - 创建CustomerBlockHandler类用于自定义限流处理逻辑

  1. public class CustomerBlockHandler {
  2. public static CommonResult handlerException(BlockException exception) {
  3. return new CommonResult(4444,"按客戶自定义,global handlerException----1");
  4. }
  5. public static CommonResult handlerException2(BlockException exception) {
  6. return new CommonResult(4444,"按客戶自定义,global handlerException----2");
  7. }
  8. }

RateLimitController

  1. @RestController
  2. public class RateLimitController {
  3. ...
  4. @GetMapping("/rateLimit/customerBlockHandler")
  5. @SentinelResource(value = "customerBlockHandler",
  6. blockHandlerClass = CustomerBlockHandler.class,//<-------- 自定义限流处理类
  7. blockHandler = "handlerException2")//<-----------
  8. public CommonResult customerBlockHandler()
  9. {
  10. return new CommonResult(200,"按客戶自定义",new Payment(2020L,"serial003"));
  11. }
  12. }

Sentinel控制台配置
image.png
启动微服务后先调用一次 - http://localhost:8401/rateLimit/customerBlockHandler。然后,多次快速刷新http://localhost:8401/rateLimit/customerBlockHandler。刷新后,我们自定义兜底方法的字符串信息就返回到前端。

4、@SentinelResource 注解

注意:注解方式埋点不支持 private 方法。
注解支持

@SentinelResource 用于定义资源,并提供可选的异常处理和 fallback 配置项。 @SentinelResource 注解包含以下属性:

  • value:资源名称,必需项(不能为空)
  • entryType:entry 类型,可选项(默认为 EntryType.OUT)
  • blockHandler / blockHandlerClass: blockHandler 对应处理 BlockException 的函数名称,可选项。blockHandler 函数访问范围需要是 public,返回类型需要与原方法相匹配,参数类型需要和原方法相匹配并且最后加一个额外的参数,类型为 BlockException。blockHandler 函数默认需要和原方法在同一个类中。若希望使用其他类的函数,则可以指定 blockHandlerClass 为对应的类的 Class 对象,注意对应的函数必需为 static 函数,否则无法解析。
  • fallback /fallbackClass:fallback 函数名称,可选项,用于在抛出异常的时候提供 fallback 处理逻辑。fallback 函数可以针对所有类型的异常(除了exceptionsToIgnore里面排除掉的异常类型)进行处理。fallback 函数签名和位置要求:
    • 返回值类型必须与原函数返回值类型一致;
    • 方法参数列表需要和原函数一致,或者可以额外多一个 Throwable 类型的参数用于接收对应的异常。
    • fallback 函数默认需要和原方法在同一个类中。若希望使用其他类的函数,则可以指定 fallbackClass 为对应的类的 Class 对象,注意对应的函数必需为 static 函数,否则无法解析。
  • defaultFallback(since 1.6.0):默认的 fallback 函数名称,可选项,通常用于通用的 fallback 逻辑(即可以用于很多服务或方法)。默认 fallback 函数可以针对所有类型的异常(除了exceptionsToIgnore里面排除掉的异常类型)进行处理。若同时配置了 fallback 和 defaultFallback,则只有 fallback 会生效。defaultFallback 函数签名要求:
    • 返回值类型必须与原函数返回值类型一致;
    • 方法参数列表需要为空,或者可以额外多一个 Throwable 类型的参数用于接收对应的异常。
    • defaultFallback 函数默认需要和原方法在同一个类中。若希望使用其他类的函数,则可以指定 fallbackClass 为对应的类的 Class 对象,注意对应的函数必需为 static 函数,否则无法解析。
  • exceptionsToIgnore(since 1.6.0):用于指定哪些异常被排除掉,不会计入异常统计中,也不会进入 fallback 逻辑中,而是会原样抛出。

Sentinel主要有三个核心Api:

  1. SphU定义资源
  2. Tracer定义统计
  3. ContextUtil定义了上下文

九、服务熔断功能

sentinel整合ribbon+openFeign+fallback

1、Ribbon系列

  • 启动nacos和sentinel
  • 提供者9003/9004
  • 消费者84

1.1、提供者9003/9004

新建cloudalibaba-provider-payment9003/9004,两个一样的做法(记得修改不同的端口号
POM

  1. <dependencies>
  2. <!--SpringCloud openfeign -->
  3. <!--
  4. <dependency>
  5. <groupId>org.springframework.cloud</groupId>
  6. <artifactId>spring-cloud-starter-openfeign</artifactId>
  7. </dependency>
  8. -->
  9. <!--SpringCloud ailibaba nacos -->
  10. <dependency>
  11. <groupId>com.alibaba.cloud</groupId>
  12. <artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId>
  13. </dependency>
  14. <!--SpringCloud ailibaba sentinel -->
  15. <dependency>
  16. <groupId>com.alibaba.cloud</groupId>
  17. <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
  18. </dependency>
  19. <!-- 引入自己定义的api通用包,可以使用Payment支付Entity -->
  20. <dependency>
  21. <groupId>com.springcloud</groupId>
  22. <artifactId>cloud-api-commons</artifactId>
  23. <version>${project.version}</version>
  24. </dependency>
  25. <!-- SpringBoot整合Web组件 -->
  26. <dependency>
  27. <groupId>org.springframework.boot</groupId>
  28. <artifactId>spring-boot-starter-web</artifactId>
  29. </dependency>
  30. <dependency>
  31. <groupId>org.springframework.boot</groupId>
  32. <artifactId>spring-boot-starter-actuator</artifactId>
  33. </dependency>
  34. <!--日常通用jar包配置-->
  35. <dependency>
  36. <groupId>org.springframework.boot</groupId>
  37. <artifactId>spring-boot-devtools</artifactId>
  38. <scope>runtime</scope>
  39. <optional>true</optional>
  40. </dependency>
  41. <dependency>
  42. <groupId>org.projectlombok</groupId>
  43. <artifactId>lombok</artifactId>
  44. <optional>true</optional>
  45. </dependency>
  46. <dependency>
  47. <groupId>org.springframework.boot</groupId>
  48. <artifactId>spring-boot-starter-test</artifactId>
  49. <scope>test</scope>
  50. </dependency>
  51. </dependencies>

YML

  1. server:
  2. port: 9003
  3. spring:
  4. application:
  5. name: nacos-payment-provider
  6. cloud:
  7. nacos:
  8. discovery:
  9. server-addr: localhost:8848 #配置Nacos地址
  10. management:
  11. endpoints:
  12. web:
  13. exposure:
  14. include: '*'

主启动

  1. @SpringBootApplication
  2. @EnableDiscoveryClient
  3. public class PaymentMain9003 {
  4. public static void main(String[] args) {
  5. SpringApplication.run(PaymentMain9003.class, args);
  6. }
  7. }

业务类

  1. @RestController
  2. public class PaymentController {
  3. @Value("${server.port}")
  4. private String serverPort;
  5. //模拟数据库
  6. public static HashMap<Long,Payment> hashMap = new HashMap<>();
  7. static
  8. {
  9. hashMap.put(1L,new Payment(1L,"28a8c1e3bc2742d8848569891fb42181"));
  10. hashMap.put(2L,new Payment(2L,"bba8c1e3bc2742d8848569891ac32182"));
  11. hashMap.put(3L,new Payment(3L,"6ua8c1e3bc2742d8848569891xt92183"));
  12. }
  13. @GetMapping(value = "/paymentSQL/{id}")
  14. public CommonResult<Payment> paymentSQL(@PathVariable("id") Long id)
  15. {
  16. Payment payment = hashMap.get(id);
  17. CommonResult<Payment> result = new CommonResult(200,"from mysql,serverPort: "+serverPort,payment);
  18. return result;
  19. }
  20. }

测试地址 - http://localhost:9003/paymentSQL/1

1.2、消费者84

新建cloudalibaba-consumer-nacos-order84
POM

  1. <dependencies>
  2. <!--SpringCloud openfeign -->
  3. <!--
  4. <dependency>
  5. <groupId>org.springframework.cloud</groupId>
  6. <artifactId>spring-cloud-starter-openfeign</artifactId>
  7. </dependency>
  8. -->
  9. <!--SpringCloud ailibaba nacos -->
  10. <dependency>
  11. <groupId>com.alibaba.cloud</groupId>
  12. <artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId>
  13. </dependency>
  14. <!--SpringCloud ailibaba sentinel -->
  15. <dependency>
  16. <groupId>com.alibaba.cloud</groupId>
  17. <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
  18. </dependency>
  19. <!-- 引入自己定义的api通用包,可以使用Payment支付Entity -->
  20. <dependency>
  21. <groupId>com.springcloud</groupId>
  22. <artifactId>cloud-api-commons</artifactId>
  23. <version>${project.version}</version>
  24. </dependency>
  25. <!-- SpringBoot整合Web组件 -->
  26. <dependency>
  27. <groupId>org.springframework.boot</groupId>
  28. <artifactId>spring-boot-starter-web</artifactId>
  29. </dependency>
  30. <dependency>
  31. <groupId>org.springframework.boot</groupId>
  32. <artifactId>spring-boot-starter-actuator</artifactId>
  33. </dependency>
  34. <!--日常通用jar包配置-->
  35. <dependency>
  36. <groupId>org.springframework.boot</groupId>
  37. <artifactId>spring-boot-devtools</artifactId>
  38. <scope>runtime</scope>
  39. <optional>true</optional>
  40. </dependency>
  41. <dependency>
  42. <groupId>org.projectlombok</groupId>
  43. <artifactId>lombok</artifactId>
  44. <optional>true</optional>
  45. </dependency>
  46. <dependency>
  47. <groupId>org.springframework.boot</groupId>
  48. <artifactId>spring-boot-starter-test</artifactId>
  49. <scope>test</scope>
  50. </dependency>
  51. </dependencies>

YML

  1. server:
  2. port: 84
  3. spring:
  4. application:
  5. name: nacos-order-consumer
  6. cloud:
  7. nacos:
  8. discovery:
  9. server-addr: localhost:8848
  10. sentinel:
  11. transport:
  12. #配置Sentinel dashboard地址
  13. dashboard: localhost:8080
  14. #默认8719端口,假如被占用会自动从8719开始依次+1扫描,直至找到未被占用的端口
  15. port: 8719
  16. #消费者将要去访问的微服务名称(注册成功进nacos的微服务提供者)
  17. service-url:
  18. nacos-user-service: http://nacos-payment-provider
  19. # 激活Sentinel对Feign的支持
  20. feign:
  21. sentinel:
  22. enabled: false

主启动

  1. @EnableDiscoveryClient
  2. @SpringBootApplication
  3. @EnableFeignClients
  4. public class OrderNacosMain84 {
  5. public static void main(String[] args) {
  6. SpringApplication.run(OrderNacosMain84.class, args);
  7. }
  8. }

业务类
ApplicationContextConfig

  1. @Configuration
  2. public class ApplicationContextConfig {
  3. @Bean
  4. @LoadBalanced
  5. public RestTemplate getRestTemplate() {
  6. return new RestTemplate();
  7. }
  8. }

CircleBreakerController

  1. @RestController
  2. @Slf4j
  3. public class CircleBreakerController {
  4. public static final String SERVICE_URL = "http://nacos-payment-provider";
  5. @Resource
  6. private RestTemplate restTemplate;
  7. @RequestMapping("/consumer/fallback/{id}")
  8. @SentinelResource(value = "fallback")//没有配置
  9. public CommonResult<Payment> fallback(@PathVariable Long id)
  10. {
  11. CommonResult<Payment> result = restTemplate.getForObject(SERVICE_URL + "/paymentSQL/"+id,CommonResult.class,id);
  12. if (id == 4) {
  13. throw new IllegalArgumentException ("IllegalArgumentException,非法参数异常....");
  14. }else if (result.getData() == null) {
  15. throw new NullPointerException ("NullPointerException,该ID没有对应记录,空指针异常");
  16. }
  17. return result;
  18. }
  19. }

修改后请重启微服务

  • 热部署对java代码级生效及时
  • 对@SentinelResource注解内属性,有时效果不好

目的

  • fallback管运行异常
  • blockHandler管配置违规

测试地址 - http://localhost:84/consumer/fallback/1

1.3、只配置fallback

fallback只负责业务异常

  1. @RestController
  2. @Slf4j
  3. public class CircleBreakerController {
  4. public static final String SERVICE_URL = "http://nacos-payment-provider";
  5. @Resource
  6. private RestTemplate restTemplate;
  7. @RequestMapping("/consumer/fallback/{id}")
  8. //@SentinelResource(value = "fallback")//没有配置
  9. @SentinelResource(value = "fallback", fallback = "handlerFallback") //fallback只负责业务异常
  10. public CommonResult<Payment> fallback(@PathVariable Long id) {
  11. CommonResult<Payment> result = restTemplate.getForObject(SERVICE_URL + "/paymentSQL/"+id,CommonResult.class,id);
  12. if (id == 4) {
  13. throw new IllegalArgumentException ("IllegalArgumentException,非法参数异常....");
  14. }else if (result.getData() == null) {
  15. throw new NullPointerException ("NullPointerException,该ID没有对应记录,空指针异常");
  16. }
  17. return result;
  18. }
  19. //本例是fallback
  20. public CommonResult handlerFallback(@PathVariable Long id,Throwable e) {
  21. Payment payment = new Payment(id,"null");
  22. return new CommonResult<>(444,"兜底异常handlerFallback,exception内容 "+e.getMessage(),payment);
  23. }
  24. }

测试地址 - http://localhost:84/consumer/fallback/4
页面返回结果:

  1. {"code":444,"message":"兜底异常nandlerFal1back, exception内容illegalkrgumentEBxceptiorn,非法参数异常……","data":{"id":4,"seria:"null"}}

1.4、只配置blockHandler

blockHandler只负责sentinel控制台配置违规

  1. @RestController
  2. @Slf4j
  3. public class CircleBreakerController
  4. {
  5. public static final String SERVICE_URL = "http://nacos-payment-provider";
  6. @Resource
  7. private RestTemplate restTemplate;
  8. @RequestMapping("/consumer/fallback/{id}")
  9. //@SentinelResource(value = "fallback") //没有配置
  10. //@SentinelResource(value = "fallback",fallback = "handlerFallback") //fallback只负责业务异常
  11. @SentinelResource(value = "fallback",blockHandler = "blockHandler") //blockHandler只负责sentinel控制台配置违规
  12. public CommonResult<Payment> fallback(@PathVariable Long id)
  13. {
  14. CommonResult<Payment> result = restTemplate.getForObject(SERVICE_URL + "/paymentSQL/"+id,CommonResult.class,id);
  15. if (id == 4) {
  16. throw new IllegalArgumentException ("IllegalArgumentException,非法参数异常....");
  17. }else if (result.getData() == null) {
  18. throw new NullPointerException ("NullPointerException,该ID没有对应记录,空指针异常");
  19. }
  20. return result;
  21. }
  22. //本例是fallback
  23. /* public CommonResult handlerFallback(@PathVariable Long id,Throwable e) {
  24. Payment payment = new Payment(id,"null");
  25. return new CommonResult<>(444,"兜底异常handlerFallback,exception内容 "+e.getMessage(),payment);
  26. }*/
  27. //本例是blockHandler
  28. public CommonResult blockHandler(@PathVariable Long id,BlockException blockException) {
  29. Payment payment = new Payment(id,"null");
  30. return new CommonResult<>(445,"blockHandler-sentinel限流,无此流水: blockException "+blockException.getMessage(),payment);
  31. }
  32. }

测试地址 - http://localhost:84/consumer/fallback/4

1.5、配置fallback和blockHandler

若blockHandler和fallback 都进行了配置,则被限流降级而抛出BlockException时只会进入blockHandler处理逻辑。

  1. @RestController
  2. @Slf4j
  3. public class CircleBreakerController
  4. {
  5. public static final String SERVICE_URL = "http://nacos-payment-provider";
  6. @Resource
  7. private RestTemplate restTemplate;
  8. @RequestMapping("/consumer/fallback/{id}")
  9. //@SentinelResource(value = "fallback") //没有配置
  10. //@SentinelResource(value = "fallback",fallback = "handlerFallback") //fallback只负责业务异常
  11. //@SentinelResource(value = "fallback",blockHandler = "blockHandler") //blockHandler只负责sentinel控制台配置违规
  12. @SentinelResource(value = "fallback",fallback = "handlerFallback",blockHandler = "blockHandler")
  13. public CommonResult<Payment> fallback(@PathVariable Long id)
  14. {
  15. CommonResult<Payment> result = restTemplate.getForObject(SERVICE_URL + "/paymentSQL/"+id,CommonResult.class,id);
  16. if (id == 4) {
  17. throw new IllegalArgumentException ("IllegalArgumentException,非法参数异常....");
  18. }else if (result.getData() == null) {
  19. throw new NullPointerException ("NullPointerException,该ID没有对应记录,空指针异常");
  20. }
  21. return result;
  22. }
  23. //本例是fallback
  24. public CommonResult handlerFallback(@PathVariable Long id,Throwable e) {
  25. Payment payment = new Payment(id,"null");
  26. return new CommonResult<>(444,"兜底异常handlerFallback,exception内容 "+e.getMessage(),payment);
  27. }
  28. //本例是blockHandler
  29. public CommonResult blockHandler(@PathVariable Long id,BlockException blockException) {
  30. Payment payment = new Payment(id,"null");
  31. return new CommonResult<>(445,"blockHandler-sentinel限流,无此流水: blockException "+blockException.getMessage(),payment);
  32. }
  33. }

1.6、忽略属性

exceptionsToIgnore,忽略指定异常,即这些异常不用兜底方法处理。

  1. @RestController
  2. @Slf4j
  3. public class CircleBreakerController
  4. ...
  5. @RequestMapping("/consumer/fallback/{id}")
  6. @SentinelResource(value = "fallback",fallback = "handlerFallback",blockHandler = "blockHandler",
  7. exceptionsToIgnore = {IllegalArgumentException.class})//<-------------
  8. public CommonResult<Payment> fallback(@PathVariable Long id)
  9. {
  10. CommonResult<Payment> result = restTemplate.getForObject(SERVICE_URL + "/paymentSQL/"+id,CommonResult.class,id);
  11. if (id == 4) {
  12. //exceptionsToIgnore属性有IllegalArgumentException.class,
  13. //所以IllegalArgumentException不会跳入指定的兜底程序。
  14. throw new IllegalArgumentException ("IllegalArgumentException,非法参数异常....");
  15. }else if (result.getData() == null) {
  16. throw new NullPointerException ("NullPointerException,该ID没有对应记录,空指针异常");
  17. }
  18. return result;
  19. }
  20. ...
  21. }

2、Feign系列

修改84模块

  • 84消费者调用提供者9003
  • Feign组件一般是消费侧

POM

  1. <!--SpringCloud openfeign -->
  2. <dependency>
  3. <groupId>org.springframework.cloud</groupId>
  4. <artifactId>spring-cloud-starter-openfeign</artifactId>
  5. </dependency>

YML

  1. # 激活Sentinel对Feign的支持
  2. feign:
  3. sentinel:
  4. enabled: true

业务类

  1. @FeignClient(value = "nacos-payment-provider",fallback = PaymentFallbackService.class)
  2. public interface PaymentService
  3. {
  4. @GetMapping(value = "/paymentSQL/{id}")
  5. public CommonResult<Payment> paymentSQL(@PathVariable("id") Long id);
  6. }
  1. @Component
  2. public class PaymentFallbackService implements PaymentService {
  3. @Override
  4. public CommonResult<Payment> paymentSQL(Long id)
  5. {
  6. return new CommonResult<>(44444,"服务降级返回,---PaymentFallbackService",new Payment(id,"errorSerial"));
  7. }
  8. }

带@Feignclient注解的业务接口,fallback = PaymentFallbackService.class
Controller

  1. @RestController
  2. @Slf4j
  3. public class CircleBreakerController {
  4. ...
  5. //==================OpenFeign
  6. @Resource
  7. private PaymentService paymentService;
  8. @GetMapping(value = "/consumer/paymentSQL/{id}")
  9. public CommonResult<Payment> paymentSQL(@PathVariable("id") Long id)
  10. {
  11. return paymentService.paymentSQL(id);
  12. }
  13. }

主启动

  1. @EnableDiscoveryClient
  2. @SpringBootApplication
  3. @EnableFeignClients//<------------------------
  4. public class OrderNacosMain84 {
  5. public static void main(String[] args) {
  6. SpringApplication.run(OrderNacosMain84.class, args);
  7. }
  8. }

测试 - http://localhost:84/consumer/paymentSQL/1
测试84调用9003,此时故意关闭9003微服务提供者,84消费侧自动降级,不会被耗死。

3、熔断限流框架对比

- Sentinel Hystrix resilience4j
隔离策略 信号量隔离(并发线程数限流) 线程池隔商/信号量隔离 信号量隔离
熔断降级策略 基于响应时间、异常比率、异常数 基于异常比率 基于异常比率、响应时间
实时统计实现 滑动窗口(LeapArray) 滑动窗口(基于RxJava) Ring Bit Buffer
动态规则配置 支持多种数据源 支持多种数据源 有限支持
扩展性 多个扩展点 插件的形式 接口的形式
基于注解的支持 支持 支持 支持
限流 基于QPS,支持基于调用关系的限流 有限的支持 Rate Limiter
流量整形 支持预热模式匀速器模式、预热排队模式 不支持 简单的Rate Limiter模式
系统自适应保护 支持 不支持 不支持
控制台 提供开箱即用的控制台,可配置规则、查看秒级监控,机器发观等 简单的监控查看 不提供控制台,可对接其它监控系统

十、规则持久化

1、是什么

一旦我们重启应用,sentinel规则将消失,生产环境需要将配置规则进行持久化。

2、怎么玩

将限流配置规则持久化进Nacos保存,只要刷新8401某个rest地址,sentinel控制台的流控规则就能看到,只要Nacos里面的配置不删除,针对8401上sentinel上的流控规则持续有效。

3、步骤

修改cloudalibaba-sentinel-service8401
POM

  1. <!--SpringCloud ailibaba sentinel-datasource-nacos 后续做持久化用到-->
  2. <dependency>
  3. <groupId>com.alibaba.csp</groupId>
  4. <artifactId>sentinel-datasource-nacos</artifactId>
  5. </dependency>

YML

  1. server:
  2. port: 8401
  3. spring:
  4. application:
  5. name: cloudalibaba-sentinel-service
  6. cloud:
  7. nacos:
  8. discovery:
  9. server-addr: localhost:8848 #Nacos服务注册中心地址
  10. sentinel:
  11. transport:
  12. dashboard: localhost:8080 #配置Sentinel dashboard地址
  13. port: 8719
  14. datasource: #<---------------------------关注点,添加Nacos数据源配置
  15. ds1:
  16. nacos:
  17. server-addr: localhost:8848
  18. dataId: cloudalibaba-sentinel-service
  19. groupId: DEFAULT_GROUP
  20. data-type: json
  21. rule-type: flow
  22. management:
  23. endpoints:
  24. web:
  25. exposure:
  26. include: '*'
  27. feign:
  28. sentinel:
  29. enabled: true # 激活Sentinel对Feign的支持

添加Nacos业务规则配置
image.png
配置内容解析

  1. [{
  2. "resource": "/rateLimit/byUrl",
  3. "IimitApp": "default",
  4. "grade": 1,
  5. "count": 1,
  6. "strategy": 0,
  7. "controlBehavior": 0,
  8. "clusterMode": false
  9. }]
  • resource:资源名称;
  • limitApp:来源应用;
  • grade:阈值类型,0表示线程数, 1表示QPS;
  • count:单机阈值;
  • strategy:流控模式,0表示直接,1表示关联,2表示链路;
  • controlBehavior:流控效果,0表示快速失败,1表示Warm Up,2表示排队等待;
  • clusterMode:是否集群。

启动8401后刷新sentinel发现业务规则有了
image.png
快速访问测试接口 - http://localhost:8401/rateLimit/byUrl - 页面返回Blocked by Sentinel (flow limiting)
停止8401再看sentinel - 停机后发现流控规则没有了
image.png
重新启动8401再看sentinel