什么是Sentinel

  • 阿里巴巴开源的分布式系统流控工具
  • 以流量为切入点,从流量控制、熔断降级、系统负载保护等多个维度保护服务的稳定性
  • 丰富的应用场景:消息削峰填谷、集群流量控制、实时熔断下游不可用应用等
  • 完备的实时监控:Sentinel 同时提供实时的监控功能
  • 提供开箱即用的与其它开源框架/库的整合模块,例如与 Spring Cloud、Dubbo、gRPC 的整合

核心概念

  • 资源:是 Sentinel 中的核心概念之一,可以是java程序中任何内容,可以是服务或者方法甚至代码,总结起来就是我们要保护的东西
  • 规则:定义怎样的方式保护资源,主要包括流控规则、熔断降级规则等

50505538-2c484880-0aaf-11e9-9ffc-cbaaef20be2b.png

微服务引入Sentinel和控制台搭建

Sentinel 分为两个部分

  • 核心库(Java 客户端)不依赖任何框架/库,能够运行于所有 Java 运行时环境,同时对 Dubbo、Spring Cloud 等框架也有较好的支持。
  • 控制台(Dashboard)基于 Spring Boot 开发,打包后可以直接运行,不需要额外的 Tomcat 等应用容器。

引入Sentinel依赖

  1. //3个服务分别添加依赖
  2. <dependency>
  3. <groupId>com.alibaba.cloud</groupId>
  4. <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
  5. </dependency>

Sentinel控制台搭建
控制台包含如下功能:

  • 查看机器列表以及健康情况:收集 Sentinel 客户端发送的心跳包,用于判断机器是否在线。
  • 监控 (单机和集群聚合)通过 Sentinel 客户端暴露的监控 API,定期拉取并且聚合应用监控信息,最终可以实现秒级的实时监控。
  • 规则管理和推送:统一管理推送规则。
  • 鉴权:生产环境中鉴权非常重要。这里每个开发者需要根据自己的实际情况进行定制。

    注意:Sentinel 控制台目前仅支持单机部署

Sentinel包:sentinel-dashboard-1.8.0.jar

//启动 Sentinel 控制台需要 JDK 版本为 1.8 及以上版本,
//默认用户名和密码都是 sentinel
//可自己指定端口
Windows启动:java -jar sentinel-dashboard-1.8.0.jar

linux启动:java -Dserver.port=8080 -Dcsp.sentinel.dashboard.server=localhost:8080 -Dproject.name=sentinel-dashboard -jar sentinel-dashboard-1.8.0.jar

//访问地址:localhost:8080

参数:
-Dserver.port=8080:指定启动端口
-Dcsp.sentinel.dashboard.server:用于控制台对外暴露的服务地址
-Dsentinel.dashboard.auth.username=sentinel: 用于指定控制台的登录用户名为 sentinel;
-Dsentinel.dashboard.auth.password=123456: 用于指定控制台的登录密码为 123456;如果省略这两个参数,默认用户和密码均为 sentinel
-Dserver.servlet.session.timeout=7200: 用于指定 Spring Boot 服务端 session 的过期时间,如 7200 表示 7200 秒;60m 表示 60 分钟,默认为 30 分钟;

image.png

多个微服务接入Sentinel配置

image.png

给订单服务和视频服务添加yml配置
spring:
  cloud:
    sentinel:
      transport:
        dashboard: 127.0.0.1:8080 
        port: 9999 

#dashboard: 8080 控制台ip和端口
#port: 9999 本地启的端口,随机选个不能被占用的,与dashboard进行数据交互,会在应用对应的机器上启动一个 Http Server,该 Server 会与 Sentinel 控制台做交互, 若被占用,则开始+1一次扫描

启动订单服务和视频服务,微服务注册上去后,由于Sentinel是懒加载模式,所以需要访问微服务后才会在控制台出现
image.png

//访问几次

http://localhost:8000/api/v1/video_order/save?videoId=40

订单服务限流配置
image.png

方便测试,配置阈值为2,并测试,多刷新几次页面,访问接口:
image.png

Sentinel流量控制详细操作

流量控制(flow control)

  • 原理是监控应用流量的 QPS 或并发线程数等指标,当达到指定的阈值时对流量进行控制,以避免被瞬时的流量高峰冲垮,从而保障应用的高可用性。

两种规则

  • 基于统计并发线程数的流量控制

    并发数控制用于保护业务线程池不被慢调用耗尽
    Sentinel 并发控制不负责创建和管理线程池,而是简单统计当前请求上下文的线程数目(正在执行的调用数目)
    如果超出阈值,新的请求会被立即拒绝,效果类似于信号量隔离。
    
  • 基于统计QPS的流量控制

    当 QPS 超过某个阈值的时候,则采取措施进行流量控制
    

    控制面板

  • 资源名:默认是请求路径,可自定义

  • 针对来源:对哪个微服务进行限流,默认是不区分来源,全部限流,这个是针对 区分上游服务进行限流, 比如 视频服务 被 订单服务、用户服务调用,就可以针对来源进行限流

image-20200908210235984.png

基于并发线程进行限流配置

//订单服务新增接口,用于测试

@GetMapping("/threadTest")
public Object threadTest(){
    try {
        TimeUnit.SECONDS.sleep(3);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    Map<String, Object> map = new HashMap<>();
    map.put("code", 200);
    map.put("title","SpringCloudAlibaba微服务");
    return map;
}

为接口增加规则
image.png

访问测试

//多访问几次
http://localhost:8000/api/v1/video_order/threadTest

注意:流控规则会下发到微服务,微服务如果重启,则流控规则会消失可以持久化配置


流量控制的效果包括以下几种
image.png**

  • 直接拒绝:默认的流量控制方式,当QPS超过任意规则的阈值后,新的请求就会被立即拒绝
  • Warm Up:冷启动/预热,如果系统在此之前长期处于空闲的状态,我们希望处理请求的数量是缓步的增多,经过预期的时间以后,到达系统处理请求个数的最大值

image.png
QQ图片20210118160545.png

  • 匀速排队:严格控制请求通过的间隔时间,也即是让请求以均匀的速度通过,对应的是漏桶算法,主要用于处理间隔性突发的流量,如消息队列,想象一下这样的场景,在某一秒有大量的请求到来,而接下来的几秒则处于空闲状态,我们希望系统能够在接下来的空闲期间逐渐处理这些请求,而不是在第一秒直接拒绝多余的请求

image.png
68292442-d4af3c00-00c6-11ea-8251-d0977366d9b4.png
注意:

  • 匀速排队等待策略是 Leaky Bucket 算法结合虚拟队列等待机制实现的。
  • 匀速排队模式暂时不支持 QPS > 1000 的场景

流控文档:点击跳转

Sentinel熔断降级规则

熔断降级(虽然是两个概念,基本都是互相配合)

  • 对调用链路中不稳定的资源进行熔断降级也是保障高可用的重要措施之一
  • 对不稳定的弱依赖服务调用进行熔断降级,暂时切断不稳定调用,避免局部不稳定因素导致整体的雪崩
  • 熔断降级作为保护自身的手段,通常在客户端(调用端)进行配置

什么是Sentinel降级规则

Sentinel 熔断策略

  • 慢调用比例(响应时间): 选择以慢调用比例作为阈值,需要设置允许的慢调用 RT(即最大的响应时间),请求的响应时间大于该值则统计为慢调用
    • 比例阈值:修改后不生效-目前已经反馈给官方那边的bug
    • 熔断时长:超过时间后会尝试恢复
    • 最小请求数:熔断触发的最小请求数,请求数小于该值时即使异常比率超出阈值也不会熔断

image-20200909121342893.png

  • 异常比例:当单位统计时长内请求数目大于设置的最小请求数目,并且异常的比例大于阈值,则接下来的熔断时长内请求会自动被熔断
    • 比例阈值
    • 熔断时长:超过时间后会尝试恢复
    • 最小请求数:熔断触发的最小请求数,请求数小于该值时,即使异常比率超出阈值也不会熔断

image-20200909121357918.png

  • 异常数:当单位统计时长内的异常数目超过阈值之后会自动进行熔断
    • 异常数:
    • 熔断时长:超过时间后会尝试恢复
    • 最小请求数:熔断触发的最小请求数,请求数小于该值时即使异常比率超出阈值也不会熔断

1.png

服务调用常见的熔断状态和恢复

服务熔断一般有三种状态

  • 熔断关闭(Closed)
    • 服务没有故障时,熔断器所处的状态,对调用方的调用不做任何限制
  • 熔断开启(Open)
    • 后续对该服务接口的调用不再经过网络,直接执行本地的fallback方法
  • 半熔断(Half-Open)
    • 所谓半熔断就是尝试恢复服务调用,允许有限的流量调用该服务,并监控调用成功率

image-20200909171947975.png
熔断恢复:

  • 经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态)尝试恢复服务调用,允许有限的流量调用该服务,并监控调用成功率。
  • 如果成功率达到预期,则说明服务已恢复,进入熔断关闭状态;如果成功率仍旧很低,则重新进入熔断状态

AlibabaCloud版本升级-自定义降级异常不向下兼容的坑

默认降级返回数据问题

  • 限流和熔断返回的数据有问题-
  • 微服务交互基本都是json格式,如果让自定义异常信息

AlibabCloud版本升级,不兼容问题

  • v2.1.0到v2.2.0后,Sentinel里面依赖进行了改动,且不向下兼容

自定义降级返回数据

  • 【旧版】实现UrlBlockHandler并且重写blocked方法

    @Component
    public class XdclassUrlBlockHandler implements UrlBlockHandler {
      @Override
      public void blocked(HttpServletRequest httpServletRequest, HttpServletResponse httpServletResponse, BlockException e) throws IOException {
         //降级业务处理
      }
    }
    
  • 【新版】实现BlockExceptionHandler并且重写handle方法

    public class XdclassUrlBlockHandler implements BlockExceptionHandler {
      @Override
      public void handle(HttpServletRequest httpServletRequest, HttpServletResponse httpServletResponse, BlockException e) throws Exception {
      //降级业务处理
      }
    }
    

新版Sentinel自定义异常数据开发

image.png
上图这个返回的一串英文,非常不友好,所以自定义异常数据。

异常种类

  • FlowException //限流异常
  • DegradeException //降级异常
  • ParamFlowException //参数限流异常
  • SystemBlockException //系统负载异常
  • AuthorityException //授权异常


在订单服务中新建config包,在config包下新建ClassUrlBlockHandler.java**

import com.alibaba.csp.sentinel.adapter.spring.webmvc.callback.BlockExceptionHandler;
import com.alibaba.csp.sentinel.slots.block.BlockException;
import com.alibaba.csp.sentinel.slots.block.authority.AuthorityException;
import com.alibaba.csp.sentinel.slots.block.degrade.DegradeException;
import com.alibaba.csp.sentinel.slots.block.flow.FlowException;
import com.alibaba.csp.sentinel.slots.block.flow.param.ParamFlowException;
import com.alibaba.csp.sentinel.slots.system.SystemBlockException;
import com.alibaba.fastjson.JSON;
import org.springframework.stereotype.Component;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.util.HashMap;
import java.util.Map;

//自定义异常返回数据
@Component
public class ClassUrlBlockHandler implements BlockExceptionHandler {
    @Override
    public void handle(HttpServletRequest req, HttpServletResponse resp, BlockException be) throws Exception {
        Map<String, Object> backMap = new HashMap<>();
        if(be instanceof FlowException){
            backMap.put("code", -1);
            backMap.put("msg", "限流异常");
        } else if(be instanceof DegradeException){
            backMap.put("code", -1);
            backMap.put("msg", "降级异常");
        } else if(be instanceof ParamFlowException){
            backMap.put("code", -1);
            backMap.put("msg", "热点参数异常");
        } else if(be instanceof SystemBlockException){
            backMap.put("code", -1);
            backMap.put("msg", "系统规则异常");
        } else if(be instanceof AuthorityException){
            backMap.put("code", -1);
            backMap.put("msg", "授权异常");
        }
        //返回json数据
        resp.setStatus(200);
        resp.setHeader("content-Type","application/json;charset=UTF-8");
        resp.getWriter().write(JSON.toJSONString(backMap));
    }
}

启动订单服务,新增流控规则,进行测试:
image.png

//多访问几次
http://localhost:8000/api/v1/video_order/threadTest

返回结果
image.png