Sentinel源码分析

1.Sentinel的基本概念

Sentinel实现限流、隔离、降级、熔断等功能,本质要做的就是两件事情:

  • 统计数据:统计某个资源的访问数据(QPS、RT等信息)
  • 规则判断:判断限流规则、隔离规则、降级规则、熔断规则是否满足

这里的资源就是希望被Sentinel保护的业务,例如项目中定义的controller方法就是默认被Sentinel保护的资源。

1.1.ProcessorSlotChain

实现上述功能的核心骨架是一个叫做ProcessorSlotChain的类。这个类基于责任链模式来设计,将不同的功能(限流、降级、系统保护)封装为一个个的Slot,请求进入后逐个执行即可。

其工作流如图:

Sentinel源码分析 - 图1

责任链中的Slot也分为两大类:

  • 统计数据构建部分(statistic)

    • NodeSelectorSlot:负责构建簇点链路中的节点(DefaultNode),将这些节点形成链路树
    • ClusterBuilderSlot:负责构建某个资源的ClusterNode,ClusterNode可以保存资源的运行信息(响应时间、QPS、block 数目、线程数、异常数等)以及来源信息(origin名称)
    • StatisticSlot:负责统计实时调用数据,包括运行信息、来源信息等
  • 规则判断部分(rule checking)

    • AuthoritySlot:负责授权规则(来源控制)
    • SystemSlot:负责系统保护规则
    • ParamFlowSlot:负责热点参数限流规则
    • FlowSlot:负责限流规则
    • DegradeSlot:负责降级规则

1.2.Node

Sentinel中的簇点链路是由一个个的Node组成的,Node是一个接口,包括下面的实现:

Sentinel源码分析 - 图2

所有的节点都可以记录对资源的访问统计数据,所以都是StatisticNode的子类。

按照作用分为两类Node:

  • DefaultNode:代表链路树中的每一个资源,一个资源出现在不同链路中时,会创建不同的DefaultNode节点。而树的入口节点叫EntranceNode,是一种特殊的DefaultNode
  • ClusterNode:代表资源,一个资源不管出现在多少链路中,只会有一个ClusterNode。记录的是当前资源被访问的所有统计数据之和。

DefaultNode记录的是资源在当前链路中的访问数据,用来实现基于链路模式的限流规则。ClusterNode记录的是资源在所有链路中的访问数据,实现默认模式、关联模式的限流规则。

例如:我们在一个SpringMVC项目中,有两个业务:

  • 业务1:controller中的资源/order/query访问了service中的资源/goods
  • 业务2:controller中的资源/order/save访问了service中的资源/goods

创建的链路图如下:

Sentinel源码分析 - 图3

1.3.Entry

默认情况下,Sentinel会将controller中的方法作为被保护资源,那么问题来了,我们该如何将自己的一段代码标记为一个Sentinel的资源呢?

Sentinel中的资源用Entry来表示。声明Entry的API示例:

  1. // 资源名可使用任意有业务语义的字符串,比如方法名、接口名或其它可唯一标识的字符串。
  2. try (Entry entry = SphU.entry("resourceName")) {
  3. // 被保护的业务逻辑
  4. // do something here...
  5. } catch (BlockException ex) {
  6. // 资源访问阻止,被限流或被降级
  7. // 在此处进行相应的处理操作
  8. }

1.3.1.自定义资源

例如,我们在order-service服务中,将OrderServicequeryOrderById()方法标记为一个资源。

1)首先在order-service中引入sentinel依赖

  1. <!--sentinel-->
  2. <dependency>
  3. <groupId>com.alibaba.cloud</groupId>
  4. <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
  5. </dependency>

2)然后配置Sentinel地址

  1. spring:
  2. cloud:
  3. sentinel:
  4. transport:
  5. dashboard: localhost:8089 # 这里我的sentinel用了8089的端口

3)修改OrderService类的queryOrderById方法

代码这样来实现:

  1. public Order queryOrderById(Long orderId) {
  2. // 创建Entry,标记资源,资源名为resource1
  3. try (Entry entry = SphU.entry("resource1")) {
  4. // 1.查询订单,这里是假数据
  5. Order order = Order.build(101L, 4999L, "小米 MIX4", 1, 1L, null);
  6. // 2.查询用户,基于Feign的远程调用
  7. User user = userClient.findById(order.getUserId());
  8. // 3.设置
  9. order.setUser(user);
  10. // 4.返回
  11. return order;
  12. }catch (BlockException e){
  13. log.error("被限流或降级", e);
  14. return null;
  15. }
  16. }

4)访问

打开浏览器,访问order服务:http://localhost:8080/order/101

然后打开sentinel控制台,查看簇点链路:

Sentinel源码分析 - 图4

1.3.2.基于注解标记资源

在之前学习Sentinel的时候,我们知道可以通过给方法添加@SentinelResource注解的形式来标记资源。

Sentinel源码分析 - 图5

这个是怎么实现的呢?

来看下我们引入的Sentinel依赖包:

Sentinel源码分析 - 图6

其中的spring.factories声明需要就是自动装配的配置类,内容如下:

Sentinel源码分析 - 图7

我们来看下SentinelAutoConfiguration这个类:

Sentinel源码分析 - 图8

可以看到,在这里声明了一个Bean,SentinelResourceAspect

  1. /**
  2. * Aspect for methods with {@link SentinelResource} annotation.
  3. *
  4. * @author Eric Zhao
  5. */
  6. @Aspect
  7. public class SentinelResourceAspect extends AbstractSentinelAspectSupport {
  8. // 切点是添加了 @SentinelResource注解的类
  9. @Pointcut("@annotation(com.alibaba.csp.sentinel.annotation.SentinelResource)")
  10. public void sentinelResourceAnnotationPointcut() {
  11. }
  12. // 环绕增强
  13. @Around("sentinelResourceAnnotationPointcut()")
  14. public Object invokeResourceWithSentinel(ProceedingJoinPoint pjp) throws Throwable {
  15. // 获取受保护的方法
  16. Method originMethod = resolveMethod(pjp);
  17. // 获取 @SentinelResource注解
  18. SentinelResource annotation = originMethod.getAnnotation(SentinelResource.class);
  19. if (annotation == null) {
  20. // Should not go through here.
  21. throw new IllegalStateException("Wrong state for SentinelResource annotation");
  22. }
  23. // 获取注解上的资源名称
  24. String resourceName = getResourceName(annotation.value(), originMethod);
  25. EntryType entryType = annotation.entryType();
  26. int resourceType = annotation.resourceType();
  27. Entry entry = null;
  28. try {
  29. // 创建资源 Entry
  30. entry = SphU.entry(resourceName, resourceType, entryType, pjp.getArgs());
  31. // 执行受保护的方法
  32. Object result = pjp.proceed();
  33. return result;
  34. } catch (BlockException ex) {
  35. return handleBlockException(pjp, annotation, ex);
  36. } catch (Throwable ex) {
  37. Class<? extends Throwable>[] exceptionsToIgnore = annotation.exceptionsToIgnore();
  38. // The ignore list will be checked first.
  39. if (exceptionsToIgnore.length > 0 && exceptionBelongsTo(ex, exceptionsToIgnore)) {
  40. throw ex;
  41. }
  42. if (exceptionBelongsTo(ex, annotation.exceptionsToTrace())) {
  43. traceException(ex);
  44. return handleFallback(pjp, annotation, ex);
  45. }
  46. // No fallback function can handle the exception, so throw it out.
  47. throw ex;
  48. } finally {
  49. if (entry != null) {
  50. entry.exit(1, pjp.getArgs());
  51. }
  52. }
  53. }
  54. }

简单来说,@SentinelResource注解就是一个标记,而Sentinel基于AOP思想,对被标记的方法做环绕增强,完成资源(Entry)的创建。

1.4.Context

上一节,我们发现簇点链路中除了controller方法、service方法两个资源外,还多了一个默认的入口节点:

sentinel_spring_web_context,是一个EntranceNode类型的节点

这个节点是在初始化Context的时候由Sentinel帮我们创建的。

1.4.1.什么是Context

那么,什么是Context呢?

  • Context 代表调用链路上下文,贯穿一次调用链路中的所有资源( Entry),基于ThreadLocal。
  • Context 维持着入口节点(entranceNode)、本次调用链路的 curNode(当前资源节点)、调用来源(origin)等信息。
  • 后续的Slot都可以通过Context拿到DefaultNode或者ClusterNode,从而获取统计数据,完成规则判断
  • Context初始化的过程中,会创建EntranceNode,contextName就是EntranceNode的名称

对应的API如下:

  1. // 创建context,包含两个参数:context名称、 来源名称
  2. ContextUtil.enter("contextName", "originName");

1.4.2.Context的初始化

那么这个Context又是在何时完成初始化的呢?

1.4.2.1.自动装配

来看下我们引入的Sentinel依赖包:

Sentinel源码分析 - 图9

其中的spring.factories声明需要就是自动装配的配置类,内容如下:

Sentinel源码分析 - 图10

我们先看SentinelWebAutoConfiguration这个类:

Sentinel源码分析 - 图11

这个类实现了WebMvcConfigurer,我们知道这个是SpringMVC自定义配置用到的类,可以配置HandlerInterceptor:

Sentinel源码分析 - 图12

可以看到这里配置了一个SentinelWebInterceptor的拦截器。

SentinelWebInterceptor的声明如下:

Sentinel源码分析 - 图13

发现它继承了AbstractSentinelInterceptor这个类。

Sentinel源码分析 - 图14

HandlerInterceptor拦截器会拦截一切进入controller的方法,执行preHandle前置拦截方法,而Context的初始化就是在这里完成的。

1.4.2.2.AbstractSentinelInterceptor

HandlerInterceptor拦截器会拦截一切进入controller的方法,执行preHandle前置拦截方法,而Context的初始化就是在这里完成的。

我们来看看这个类的preHandle实现:

  1. @Override
  2. public boolean preHandle(HttpServletRequest request, HttpServletResponse response, Object handler)
  3. throws Exception {
  4. try {
  5. // 获取资源名称,一般是controller方法的@RequestMapping路径,例如/order/{orderId}
  6. String resourceName = getResourceName(request);
  7. if (StringUtil.isEmpty(resourceName)) {
  8. return true;
  9. }
  10. // 从request中获取请求来源,将来做 授权规则 判断时会用
  11. String origin = parseOrigin(request);
  12. // 获取 contextName,默认是sentinel_spring_web_context
  13. String contextName = getContextName(request);
  14. // 创建 Context
  15. ContextUtil.enter(contextName, origin);
  16. // 创建资源,名称就是当前请求的controller方法的映射路径
  17. Entry entry = SphU.entry(resourceName, ResourceTypeConstants.COMMON_WEB, EntryType.IN);
  18. request.setAttribute(baseWebMvcConfig.getRequestAttributeName(), entry);
  19. return true;
  20. } catch (BlockException e) {
  21. try {
  22. handleBlockException(request, response, e);
  23. } finally {
  24. ContextUtil.exit();
  25. }
  26. return false;
  27. }
  28. }

1.4.2.3.ContextUtil

创建Context的方法就是ContextUtil.enter(contextName, origin);

我们进入该方法:

  1. public static Context enter(String name, String origin) {
  2. if (Constants.CONTEXT_DEFAULT_NAME.equals(name)) {
  3. throw new ContextNameDefineException(
  4. "The " + Constants.CONTEXT_DEFAULT_NAME + " can't be permit to defined!");
  5. }
  6. return trueEnter(name, origin);
  7. }

进入trueEnter方法:

  1. protected static Context trueEnter(String name, String origin) {
  2. // 尝试获取context
  3. Context context = contextHolder.get();
  4. // 判空
  5. if (context == null) {
  6. // 如果为空,开始初始化
  7. Map<String, DefaultNode> localCacheNameMap = contextNameNodeMap;
  8. // 尝试获取入口节点
  9. DefaultNode node = localCacheNameMap.get(name);
  10. if (node == null) {
  11. LOCK.lock();
  12. try {
  13. node = contextNameNodeMap.get(name);
  14. if (node == null) {
  15. // 入口节点为空,初始化入口节点 EntranceNode
  16. node = new EntranceNode(new StringResourceWrapper(name, EntryType.IN), null);
  17. // 添加入口节点到 ROOT
  18. Constants.ROOT.addChild(node);
  19. // 将入口节点放入缓存
  20. Map<String, DefaultNode> newMap = new HashMap<>(contextNameNodeMap.size() + 1);
  21. newMap.putAll(contextNameNodeMap);
  22. newMap.put(name, node);
  23. contextNameNodeMap = newMap;
  24. }
  25. } finally {
  26. LOCK.unlock();
  27. }
  28. }
  29. // 创建Context,参数为:入口节点 和 contextName
  30. context = new Context(node, name);
  31. // 设置请求来源 origin
  32. context.setOrigin(origin);
  33. // 放入ThreadLocal
  34. contextHolder.set(context);
  35. }
  36. // 返回
  37. return context;
  38. }

2.ProcessorSlotChain执行流程

接下来我们跟踪源码,验证下ProcessorSlotChain的执行流程。

2.1.入口

首先,回到一切的入口,AbstractSentinelInterceptor类的preHandle方法:

Sentinel源码分析 - 图15

还有,SentinelResourceAspect的环绕增强方法:

Sentinel源码分析 - 图16

可以看到,任何一个资源必定要执行SphU.entry()这个方法:

  1. public static Entry entry(String name, int resourceType, EntryType trafficType, Object[] args)
  2. throws BlockException {
  3. return Env.sph.entryWithType(name, resourceType, trafficType, 1, args);
  4. }

继续进入Env.sph.entryWithType(name, resourceType, trafficType, 1, args);

  1. @Override
  2. public Entry entryWithType(String name, int resourceType, EntryType entryType, int count, boolean prioritized,
  3. Object[] args) throws BlockException {
  4. // 将 资源名称等基本信息 封装为一个 StringResourceWrapper对象
  5. StringResourceWrapper resource = new StringResourceWrapper(name, entryType, resourceType);
  6. // 继续
  7. return entryWithPriority(resource, count, prioritized, args);
  8. }

进入entryWithPriority方法:

  1. private Entry entryWithPriority(ResourceWrapper resourceWrapper, int count, boolean prioritized, Object... args)
  2. throws BlockException {
  3. // 获取 Context
  4. Context context = ContextUtil.getContext();
  5. if (context == null) {
  6. // Using default context.
  7. context = InternalContextUtil.internalEnter(Constants.CONTEXT_DEFAULT_NAME);
  8. }
  9. // 获取 Slot执行链,同一个资源,会创建一个执行链,放入缓存
  10. ProcessorSlot<Object> chain = lookProcessChain(resourceWrapper);
  11. // 创建 Entry,并将 resource、chain、context 记录在 Entry中
  12. Entry e = new CtEntry(resourceWrapper, chain, context);
  13. try {
  14. // 执行 slotChain
  15. chain.entry(context, resourceWrapper, null, count, prioritized, args);
  16. } catch (BlockException e1) {
  17. e.exit(count, args);
  18. throw e1;
  19. } catch (Throwable e1) {
  20. // This should not happen, unless there are errors existing in Sentinel internal.
  21. RecordLog.info("Sentinel unexpected exception", e1);
  22. }
  23. return e;
  24. }

在这段代码中,会获取ProcessorSlotChain对象,然后基于chain.entry()开始执行slotChain中的每一个Slot. 而这里创建的是其实现类:DefaultProcessorSlotChain.

获取ProcessorSlotChain以后会保存到一个Map中,key是ResourceWrapper,值是ProcessorSlotChain.

所以,一个资源只会有一个ProcessorSlotChain.

2.2.DefaultProcessorSlotChain

我们进入DefaultProcessorSlotChain的entry方法:

  1. @Override
  2. public void entry(Context context, ResourceWrapper resourceWrapper, Object t, int count, boolean prioritized, Object... args)
  3. throws Throwable {
  4. // first,就是责任链中的第一个 slot
  5. first.transformEntry(context, resourceWrapper, t, count, prioritized, args);
  6. }

这里的first,类型是AbstractLinkedProcessorSlot:

Sentinel源码分析 - 图17

看下继承关系:

Sentinel源码分析 - 图18

因此,first一定是这些实现类中的一个,按照最早讲的责任链顺序,first应该就是 NodeSelectorSlot

不过,既然是基于责任链模式,所以这里只要记住下一个slot就可以了,也就是next:

Sentinel源码分析 - 图19

next确实是NodeSelectSlot类型。

而NodeSelectSlot的next一定是ClusterBuilderSlot,依次类推:

Sentinel源码分析 - 图20

责任链就建立起来了。

2.3.NodeSelectorSlot

NodeSelectorSlot负责构建簇点链路中的节点(DefaultNode),将这些节点形成链路树。

核心代码:

  1. @Override
  2. public void entry(Context context, ResourceWrapper resourceWrapper, Object obj, int count, boolean prioritized, Object... args)
  3. throws Throwable {
  4. // 尝试获取 当前资源的 DefaultNode
  5. DefaultNode node = map.get(context.getName());
  6. if (node == null) {
  7. synchronized (this) {
  8. node = map.get(context.getName());
  9. if (node == null) {
  10. // 如果为空,为当前资源创建一个新的 DefaultNode
  11. node = new DefaultNode(resourceWrapper, null);
  12. HashMap<String, DefaultNode> cacheMap = new HashMap<String, DefaultNode>(map.size());
  13. cacheMap.putAll(map);
  14. // 放入缓存中,注意这里的 key是contextName,
  15. // 这样不同链路进入相同资源,就会创建多个 DefaultNode
  16. cacheMap.put(context.getName(), node);
  17. map = cacheMap;
  18. // 当前节点加入上一节点的 child中,这样就构成了调用链路树
  19. ((DefaultNode) context.getLastNode()).addChild(node);
  20. }
  21. }
  22. }
  23. // context中的curNode(当前节点)设置为新的 node
  24. context.setCurNode(node);
  25. // 执行下一个 slot
  26. fireEntry(context, resourceWrapper, node, count, prioritized, args);
  27. }

这个Slot完成了这么几件事情:

  • 为当前资源创建 DefaultNode
  • 将DefaultNode放入缓存中,key是contextName,这样不同链路入口的请求,将会创建多个DefaultNode,相同链路则只有一个DefaultNode
  • 将当前资源的DefaultNode设置为上一个资源的childNode
  • 将当前资源的DefaultNode设置为Context中的curNode(当前节点)

下一个slot,就是ClusterBuilderSlot

2.4.ClusterBuilderSlot

ClusterBuilderSlot负责构建某个资源的ClusterNode,核心代码:

  1. @Override
  2. public void entry(Context context, ResourceWrapper resourceWrapper, DefaultNode node,
  3. int count, boolean prioritized, Object... args)
  4. throws Throwable {
  5. // 判空,注意ClusterNode是共享的成员变量,也就是说一个资源只有一个ClusterNode,与链路无关
  6. if (clusterNode == null) {
  7. synchronized (lock) {
  8. if (clusterNode == null) {
  9. // 创建 cluster node.
  10. clusterNode = new ClusterNode(resourceWrapper.getName(), resourceWrapper.getResourceType());
  11. HashMap<ResourceWrapper, ClusterNode> newMap = new HashMap<>(Math.max(clusterNodeMap.size(), 16));
  12. newMap.putAll(clusterNodeMap);
  13. // 放入缓存,可以是nodeId,也就是resource名称
  14. newMap.put(node.getId(), clusterNode);
  15. clusterNodeMap = newMap;
  16. }
  17. }
  18. }
  19. // 将资源的 DefaultNode与 ClusterNode关联
  20. node.setClusterNode(clusterNode);
  21. // 记录请求来源 origin 将 origin放入 entry
  22. if (!"".equals(context.getOrigin())) {
  23. Node originNode = node.getClusterNode().getOrCreateOriginNode(context.getOrigin());
  24. context.getCurEntry().setOriginNode(originNode);
  25. }
  26. // 继续下一个slot
  27. fireEntry(context, resourceWrapper, node, count, prioritized, args);
  28. }

2.5.StatisticSlot

StatisticSlot负责统计实时调用数据,包括运行信息(访问次数、线程数)、来源信息等。

StatisticSlot是实现限流的关键,其中基于滑动时间窗口算法维护了计数器,统计进入某个资源的请求次数。

核心代码:

  1. @Override
  2. public void entry(Context context, ResourceWrapper resourceWrapper, DefaultNode node,
  3. int count, boolean prioritized, Object... args) throws Throwable {
  4. try {
  5. // 放行到下一个 slot,做限流、降级等判断
  6. fireEntry(context, resourceWrapper, node, count, prioritized, args);
  7. // 请求通过了, 线程计数器 +1 ,用作线程隔离
  8. node.increaseThreadNum();
  9. // 请求计数器 +1 用作限流
  10. node.addPassRequest(count);
  11. if (context.getCurEntry().getOriginNode() != null) {
  12. // 如果有 origin,来源计数器也都要 +1
  13. context.getCurEntry().getOriginNode().increaseThreadNum();
  14. context.getCurEntry().getOriginNode().addPassRequest(count);
  15. }
  16. if (resourceWrapper.getEntryType() == EntryType.IN) {
  17. // 如果是入口资源,还要给全局计数器 +1.
  18. Constants.ENTRY_NODE.increaseThreadNum();
  19. Constants.ENTRY_NODE.addPassRequest(count);
  20. }
  21. // 请求通过后的回调.
  22. for (ProcessorSlotEntryCallback<DefaultNode> handler : StatisticSlotCallbackRegistry.getEntryCallbacks()) {
  23. handler.onPass(context, resourceWrapper, node, count, args);
  24. }
  25. } catch (Throwable e) {
  26. // 各种异常处理就省略了。。。
  27. context.getCurEntry().setError(e);
  28. throw e;
  29. }
  30. }

另外,需要注意的是,所有的计数+1动作都包括两部分,以node.addPassRequest(count);为例:

  1. @Override
  2. public void addPassRequest(int count) {
  3. // DefaultNode的计数器,代表当前链路的 计数器
  4. super.addPassRequest(count);
  5. // ClusterNode计数器,代表当前资源的 总计数器
  6. this.clusterNode.addPassRequest(count);
  7. }

具体计数方式,我们后续再看。

接下来,进入规则校验的相关slot了,依次是:

  • AuthoritySlot:负责授权规则(来源控制)
  • SystemSlot:负责系统保护规则
  • ParamFlowSlot:负责热点参数限流规则
  • FlowSlot:负责限流规则
  • DegradeSlot:负责降级规则

2.6.AuthoritySlot

负责请求来源origin的授权规则判断,如图:

Sentinel源码分析 - 图21

核心API:

  1. @Override
  2. public void entry(Context context, ResourceWrapper resourceWrapper, DefaultNode node, int count, boolean prioritized, Object... args)
  3. throws Throwable {
  4. // 校验黑白名单
  5. checkBlackWhiteAuthority(resourceWrapper, context);
  6. // 进入下一个 slot
  7. fireEntry(context, resourceWrapper, node, count, prioritized, args);
  8. }

黑白名单校验的逻辑:

  1. void checkBlackWhiteAuthority(ResourceWrapper resource, Context context) throws AuthorityException {
  2. // 获取授权规则
  3. Map<String, Set<AuthorityRule>> authorityRules = AuthorityRuleManager.getAuthorityRules();
  4. if (authorityRules == null) {
  5. return;
  6. }
  7. Set<AuthorityRule> rules = authorityRules.get(resource.getName());
  8. if (rules == null) {
  9. return;
  10. }
  11. // 遍历规则并判断
  12. for (AuthorityRule rule : rules) {
  13. if (!AuthorityRuleChecker.passCheck(rule, context)) {
  14. // 规则不通过,直接抛出异常
  15. throw new AuthorityException(context.getOrigin(), rule);
  16. }
  17. }
  18. }

再看下AuthorityRuleChecker.passCheck(rule, context)方法:

  1. static boolean passCheck(AuthorityRule rule, Context context) {
  2. // 得到请求来源 origin
  3. String requester = context.getOrigin();
  4. // 来源为空,或者规则为空,都直接放行
  5. if (StringUtil.isEmpty(requester) || StringUtil.isEmpty(rule.getLimitApp())) {
  6. return true;
  7. }
  8. // rule.getLimitApp()得到的就是 白名单 或 黑名单 的字符串,这里先用 indexOf方法判断
  9. int pos = rule.getLimitApp().indexOf(requester);
  10. boolean contain = pos > -1;
  11. if (contain) {
  12. // 如果包含 origin,还要进一步做精确判断,把名单列表以","分割,逐个判断
  13. boolean exactlyMatch = false;
  14. String[] appArray = rule.getLimitApp().split(",");
  15. for (String app : appArray) {
  16. if (requester.equals(app)) {
  17. exactlyMatch = true;
  18. break;
  19. }
  20. }
  21. contain = exactlyMatch;
  22. }
  23. // 如果是黑名单,并且包含origin,则返回false
  24. int strategy = rule.getStrategy();
  25. if (strategy == RuleConstant.AUTHORITY_BLACK && contain) {
  26. return false;
  27. }
  28. // 如果是白名单,并且不包含origin,则返回false
  29. if (strategy == RuleConstant.AUTHORITY_WHITE && !contain) {
  30. return false;
  31. }
  32. // 其它情况返回true
  33. return true;
  34. }

2.7.SystemSlot

SystemSlot是对系统保护的规则校验:

Sentinel源码分析 - 图22

核心API:

  1. @Override
  2. public void entry(Context context, ResourceWrapper resourceWrapper, DefaultNode node,
  3. int count,boolean prioritized, Object... args) throws Throwable {
  4. // 系统规则校验
  5. SystemRuleManager.checkSystem(resourceWrapper);
  6. // 进入下一个 slot
  7. fireEntry(context, resourceWrapper, node, count, prioritized, args);
  8. }

来看下SystemRuleManager.checkSystem(resourceWrapper);的代码:

  1. public static void checkSystem(ResourceWrapper resourceWrapper) throws BlockException {
  2. if (resourceWrapper == null) {
  3. return;
  4. }
  5. // Ensure the checking switch is on.
  6. if (!checkSystemStatus.get()) {
  7. return;
  8. }
  9. // 只针对入口资源做校验,其它直接返回
  10. if (resourceWrapper.getEntryType() != EntryType.IN) {
  11. return;
  12. }
  13. // 全局 QPS校验
  14. double currentQps = Constants.ENTRY_NODE == null ? 0.0 : Constants.ENTRY_NODE.successQps();
  15. if (currentQps > qps) {
  16. throw new SystemBlockException(resourceWrapper.getName(), "qps");
  17. }
  18. // 全局 线程数 校验
  19. int currentThread = Constants.ENTRY_NODE == null ? 0 : Constants.ENTRY_NODE.curThreadNum();
  20. if (currentThread > maxThread) {
  21. throw new SystemBlockException(resourceWrapper.getName(), "thread");
  22. }
  23. // 全局平均 RT校验
  24. double rt = Constants.ENTRY_NODE == null ? 0 : Constants.ENTRY_NODE.avgRt();
  25. if (rt > maxRt) {
  26. throw new SystemBlockException(resourceWrapper.getName(), "rt");
  27. }
  28. // 全局 系统负载 校验
  29. if (highestSystemLoadIsSet && getCurrentSystemAvgLoad() > highestSystemLoad) {
  30. if (!checkBbr(currentThread)) {
  31. throw new SystemBlockException(resourceWrapper.getName(), "load");
  32. }
  33. }
  34. // 全局 CPU使用率 校验
  35. if (highestCpuUsageIsSet && getCurrentCpuUsage() > highestCpuUsage) {
  36. throw new SystemBlockException(resourceWrapper.getName(), "cpu");
  37. }
  38. }

2.8.ParamFlowSlot

ParamFlowSlot就是热点参数限流,如图:

Sentinel源码分析 - 图23

是针对进入资源的请求,针对不同的请求参数值分别统计QPS的限流方式。

  • 这里的单机阈值,就是最大令牌数量:maxCount

  • 这里的统计窗口时长,就是统计时长:duration

含义是每隔duration时间长度内,最多生产maxCount个令牌,上图配置的含义是每1秒钟生产2个令牌。

核心API:

  1. @Override
  2. public void entry(Context context, ResourceWrapper resourceWrapper, DefaultNode node,
  3. int count, boolean prioritized, Object... args) throws Throwable {
  4. // 如果没有设置热点规则,直接放行
  5. if (!ParamFlowRuleManager.hasRules(resourceWrapper.getName())) {
  6. fireEntry(context, resourceWrapper, node, count, prioritized, args);
  7. return;
  8. }
  9. // 热点规则判断
  10. checkFlow(resourceWrapper, count, args);
  11. // 进入下一个 slot
  12. fireEntry(context, resourceWrapper, node, count, prioritized, args);
  13. }

2.8.1.令牌桶

热点规则判断采用了令牌桶算法来实现参数限流,为每一个不同参数值设置令牌桶,Sentinel的令牌桶有两部分组成:

Sentinel源码分析 - 图24

这两个Map的key都是请求的参数值,value却不同,其中:

  • tokenCounters:用来记录剩余令牌数量
  • timeCounters:用来记录上一个请求的时间

当一个携带参数的请求到来后,基本判断流程是这样的:

Sentinel源码分析 - 图25

2.9.FlowSlot

FlowSlot是负责限流规则的判断,如图:

Sentinel源码分析 - 图26

包括:

  • 三种流控模式:直接模式、关联模式、链路模式
  • 三种流控效果:快速失败、warm up、排队等待

三种流控模式,从底层数据统计角度,分为两类:

  • 对进入资源的所有请求(ClusterNode)做限流统计:直接模式、关联模式
  • 对进入资源的部分链路(DefaultNode)做限流统计:链路模式

三种流控效果,从限流算法来看,分为两类:

  • 滑动时间窗口算法:快速失败、warm up
  • 漏桶算法:排队等待效果

2.9.1.核心流程

核心API如下:

  1. @Override
  2. public void entry(Context context, ResourceWrapper resourceWrapper, DefaultNode node, int count,
  3. boolean prioritized, Object... args) throws Throwable {
  4. // 限流规则检测
  5. checkFlow(resourceWrapper, context, node, count, prioritized);
  6. // 放行
  7. fireEntry(context, resourceWrapper, node, count, prioritized, args);
  8. }

checkFlow方法:

  1. void checkFlow(ResourceWrapper resource, Context context, DefaultNode node, int count, boolean prioritized)
  2. throws BlockException {
  3. // checker是 FlowRuleChecker 类的一个对象
  4. checker.checkFlow(ruleProvider, resource, context, node, count, prioritized);
  5. }

跟入FlowRuleChecker:

  1. public void checkFlow(Function<String, Collection<FlowRule>> ruleProvider,
  2. ResourceWrapper resource,Context context, DefaultNode node,
  3. int count, boolean prioritized) throws BlockException {
  4. if (ruleProvider == null || resource == null) {
  5. return;
  6. }
  7. // 获取当前资源的所有限流规则
  8. Collection<FlowRule> rules = ruleProvider.apply(resource.getName());
  9. if (rules != null) {
  10. for (FlowRule rule : rules) {
  11. // 遍历,逐个规则做校验
  12. if (!canPassCheck(rule, context, node, count, prioritized)) {
  13. throw new FlowException(rule.getLimitApp(), rule);
  14. }
  15. }
  16. }
  17. }

这里的FlowRule就是限流规则接口,其中的几个成员变量,刚好对应表单参数:

  1. public class FlowRule extends AbstractRule {
  2. /**
  3. * 阈值类型 (0: 线程, 1: QPS).
  4. */
  5. private int grade = RuleConstant.FLOW_GRADE_QPS;
  6. /**
  7. * 阈值.
  8. */
  9. private double count;
  10. /**
  11. * 三种限流模式.
  12. *
  13. * {@link RuleConstant#STRATEGY_DIRECT} 直连模式;
  14. * {@link RuleConstant#STRATEGY_RELATE} 关联模式;
  15. * {@link RuleConstant#STRATEGY_CHAIN} 链路模式.
  16. */
  17. private int strategy = RuleConstant.STRATEGY_DIRECT;
  18. /**
  19. * 关联模式关联的资源名称.
  20. */
  21. private String refResource;
  22. /**
  23. * 3种流控效果.
  24. * 0. 快速失败, 1. warm up, 2. 排队等待, 3. warm up + 排队等待
  25. */
  26. private int controlBehavior = RuleConstant.CONTROL_BEHAVIOR_DEFAULT;
  27. // 预热时长
  28. private int warmUpPeriodSec = 10;
  29. /**
  30. * 队列最大等待时间.
  31. */
  32. private int maxQueueingTimeMs = 500;
  33. // 。。。 略
  34. }

校验的逻辑定义在FlowRuleCheckercanPassCheck方法中:

  1. public boolean canPassCheck(/*@NonNull*/ FlowRule rule, Context context, DefaultNode node, int acquireCount,
  2. boolean prioritized) {
  3. // 获取限流资源名称
  4. String limitApp = rule.getLimitApp();
  5. if (limitApp == null) {
  6. return true;
  7. }
  8. // 校验规则
  9. return passLocalCheck(rule, context, node, acquireCount, prioritized);
  10. }

进入passLocalCheck()

  1. private static boolean passLocalCheck(FlowRule rule, Context context, DefaultNode node,
  2. int acquireCount, boolean prioritized) {
  3. // 基于限流模式判断要统计的节点,
  4. // 如果是直连模式,关联模式,对ClusterNode统计,如果是链路模式,则对DefaultNode统计
  5. Node selectedNode = selectNodeByRequesterAndStrategy(rule, context, node);
  6. if (selectedNode == null) {
  7. return true;
  8. }
  9. // 判断规则
  10. return rule.getRater().canPass(selectedNode, acquireCount, prioritized);
  11. }

这里对规则的判断先要通过FlowRule#getRater()获取流量控制器TrafficShapingController,然后再做限流。

TrafficShapingController有3种实现:

Sentinel源码分析 - 图27

  • DefaultController:快速失败,默认的方式,基于滑动时间窗口算法
  • WarmUpController:预热模式,基于滑动时间窗口算法,只不过阈值是动态的
  • RateLimiterController:排队等待模式,基于漏桶算法

最终的限流判断都在TrafficShapingController的canPass方法中。

2.9.2.滑动时间窗口

滑动时间窗口的功能分两部分来看:

  • 一是时间区间窗口的QPS计数功能,这个是在StatisticSlot中调用的
  • 二是对滑动窗口内的时间区间窗口QPS累加,这个是在FlowRule中调用的

先来看时间区间窗口的QPS计数功能。

2.9.2.1.时间窗口请求量统计

回顾2.5章节中的StatisticSlot部分,有这样一段代码:

Sentinel源码分析 - 图28

就是在统计通过该节点的QPS,我们跟入看看,这里进入了DefaultNode内部:

Sentinel源码分析 - 图29

发现同时对DefaultNodeClusterNode在做QPS统计,我们知道DefaultNodeClusterNode都是StatisticNode的子类,这里调用addPassRequest()方法,最终都会进入StatisticNode中。

随便跟入一个:

Sentinel源码分析 - 图30

这里有秒、分两种纬度的统计,对应两个计数器。找到对应的成员变量,可以看到:

Sentinel源码分析 - 图31

两个计数器都是ArrayMetric类型,并且传入了两个参数:

  1. // intervalInMs:是滑动窗口的时间间隔,默认为 1 秒
  2. // sampleCount: 时间窗口的分隔数量,默认为 2,就是把 1秒分为 2个小时间窗
  3. public ArrayMetric(int sampleCount, int intervalInMs) {
  4. this.data = new OccupiableBucketLeapArray(sampleCount, intervalInMs);
  5. }

如图:

Sentinel源码分析 - 图32

接下来,我们进入ArrayMetric类的addPass方法:

  1. @Override
  2. public void addPass(int count) {
  3. // 获取当前时间所在的时间窗
  4. WindowWrap<MetricBucket> wrap = data.currentWindow();
  5. // 计数器 +1
  6. wrap.value().addPass(count);
  7. }

那么,计数器如何知道当前所在的窗口是哪个呢?

这里的data是一个LeapArray:

Sentinel源码分析 - 图33

LeapArray的四个属性:

  1. public abstract class LeapArray<T> {
  2. // 小窗口的时间长度,默认是500ms ,值 = intervalInMs / sampleCount
  3. protected int windowLengthInMs;
  4. // 滑动窗口内的 小窗口 数量,默认为 2
  5. protected int sampleCount;
  6. // 滑动窗口的时间间隔,默认为 1000ms
  7. protected int intervalInMs;
  8. // 滑动窗口的时间间隔,单位为秒,默认为 1
  9. private double intervalInSecond;
  10. }

LeapArray是一个环形数组,因为时间是无限的,数组长度不可能无限,因此数组中每一个格子放入一个时间窗(window),当数组放满后,角标归0,覆盖最初的window。

Sentinel源码分析 - 图34

因为滑动窗口最多分成sampleCount数量的小窗口,因此数组长度只要大于sampleCount,那么最近的一个滑动窗口内的2个小窗口就永远不会被覆盖,就不用担心旧数据被覆盖的问题了。

我们跟入data.currentWindow();方法:

  1. public WindowWrap<T> currentWindow(long timeMillis) {
  2. if (timeMillis < 0) {
  3. return null;
  4. }
  5. // 计算当前时间对应的数组角标
  6. int idx = calculateTimeIdx(timeMillis);
  7. // 计算当前时间所在窗口的开始时间.
  8. long windowStart = calculateWindowStart(timeMillis);
  9. /*
  10. * 先根据角标获取数组中保存的 oldWindow 对象,可能是旧数据,需要判断.
  11. *
  12. * (1) oldWindow 不存在, 说明是第一次,创建新 window并存入,然后返回即可
  13. * (2) oldWindow的 starTime = 本次请求的 windowStar, 说明正是要找的窗口,直接返回.
  14. * (3) oldWindow的 starTime < 本次请求的 windowStar, 说明是旧数据,需要被覆盖,创建
  15. * 新窗口,覆盖旧窗口
  16. */
  17. while (true) {
  18. WindowWrap<T> old = array.get(idx);
  19. if (old == null) {
  20. // 创建新 window
  21. WindowWrap<T> window = new WindowWrap<T>(windowLengthInMs, windowStart, newEmptyBucket(timeMillis));
  22. // 基于CAS写入数组,避免线程安全问题
  23. if (array.compareAndSet(idx, null, window)) {
  24. // 写入成功,返回新的 window
  25. return window;
  26. } else {
  27. // 写入失败,说明有并发更新,等待其它人更新完成即可
  28. Thread.yield();
  29. }
  30. } else if (windowStart == old.windowStart()) {
  31. return old;
  32. } else if (windowStart > old.windowStart()) {
  33. if (updateLock.tryLock()) {
  34. try {
  35. // 获取并发锁,覆盖旧窗口并返回
  36. return resetWindowTo(old, windowStart);
  37. } finally {
  38. updateLock.unlock();
  39. }
  40. } else {
  41. // 获取锁失败,等待其它线程处理就可以了
  42. Thread.yield();
  43. }
  44. } else if (windowStart < old.windowStart()) {
  45. // 这种情况不应该存在,写这里只是以防万一。
  46. return new WindowWrap<T>(windowLengthInMs, windowStart, newEmptyBucket(timeMillis));
  47. }
  48. }
  49. }

找到当前时间所在窗口(WindowWrap)后,只要调用WindowWrap对象中的add方法,计数器+1即可。

这里只负责统计每个窗口的请求量,不负责拦截。限流拦截要看FlowSlot中的逻辑。

2.9.2.2.滑动窗口QPS计算

在2.9.1小节我们讲过,FlowSlot的限流判断最终都由TrafficShapingController接口中的canPass方法来实现。该接口有三个实现类:

  • DefaultController:快速失败,默认的方式,基于滑动时间窗口算法
  • WarmUpController:预热模式,基于滑动时间窗口算法,只不过阈值是动态的
  • RateLimiterController:排队等待模式,基于漏桶算法

因此,我们跟入默认的DefaultController中的canPass方法来分析:

  1. @Override
  2. public boolean canPass(Node node, int acquireCount, boolean prioritized) {
  3. // 计算目前为止滑动窗口内已经存在的请求量
  4. int curCount = avgUsedTokens(node);
  5. // 判断:已使用请求量 + 需要的请求量(1) 是否大于 窗口的请求阈值
  6. if (curCount + acquireCount > count) {
  7. // 大于,说明超出阈值,返回false
  8. if (prioritized && grade == RuleConstant.FLOW_GRADE_QPS) {
  9. long currentTime;
  10. long waitInMs;
  11. currentTime = TimeUtil.currentTimeMillis();
  12. waitInMs = node.tryOccupyNext(currentTime, acquireCount, count);
  13. if (waitInMs < OccupyTimeoutProperty.getOccupyTimeout()) {
  14. node.addWaitingRequest(currentTime + waitInMs, acquireCount);
  15. node.addOccupiedPass(acquireCount);
  16. sleep(waitInMs);
  17. // PriorityWaitException indicates that the request will pass after waiting for {@link @waitInMs}.
  18. throw new PriorityWaitException(waitInMs);
  19. }
  20. }
  21. return false;
  22. }
  23. // 小于等于,说明在阈值范围内,返回true
  24. return true;
  25. }

因此,判断的关键就是int curCount = avgUsedTokens(node);

  1. private int avgUsedTokens(Node node) {
  2. if (node == null) {
  3. return DEFAULT_AVG_USED_TOKENS;
  4. }
  5. return grade == RuleConstant.FLOW_GRADE_THREAD ? node.curThreadNum() : (int)(node.passQps());
  6. }

因为我们采用的是限流,走node.passQps()逻辑:

  1. // 这里又进入了 StatisticNode类
  2. @Override
  3. public double passQps() {
  4. // 请求量 ÷ 滑动窗口时间间隔 ,得到的就是QPS
  5. return rollingCounterInSecond.pass() / rollingCounterInSecond.getWindowIntervalInSec();
  6. }

那么rollingCounterInSecond.pass()是如何得到请求量的呢?

  1. // rollingCounterInSecond 本质是ArrayMetric,之前说过
  2. @Override
  3. public long pass() {
  4. // 获取当前窗口
  5. data.currentWindow();
  6. long pass = 0;
  7. // 获取 当前时间的 滑动窗口范围内 的所有小窗口
  8. List<MetricBucket> list = data.values();
  9. // 遍历
  10. for (MetricBucket window : list) {
  11. // 累加求和
  12. pass += window.pass();
  13. }
  14. // 返回
  15. return pass;
  16. }

来看看data.values()如何获取 滑动窗口范围内 的所有小窗口:

  1. // 此处进入LeapArray类中:
  2. public List<T> values(long timeMillis) {
  3. if (timeMillis < 0) {
  4. return new ArrayList<T>();
  5. }
  6. // 创建空集合,大小等于 LeapArray长度
  7. int size = array.length();
  8. List<T> result = new ArrayList<T>(size);
  9. // 遍历 LeapArray
  10. for (int i = 0; i < size; i++) {
  11. // 获取每一个小窗口
  12. WindowWrap<T> windowWrap = array.get(i);
  13. // 判断这个小窗口是否在 滑动窗口时间范围内(1秒内)
  14. if (windowWrap == null || isWindowDeprecated(timeMillis, windowWrap)) {
  15. // 不在范围内,则跳过
  16. continue;
  17. }
  18. // 在范围内,则添加到集合中
  19. result.add(windowWrap.value());
  20. }
  21. // 返回集合
  22. return result;
  23. }

那么,isWindowDeprecated(timeMillis, windowWrap)又是如何判断窗口是否符合要求呢?

  1. public boolean isWindowDeprecated(long time, WindowWrap<T> windowWrap) {
  2. // 当前时间 - 窗口开始时间 是否大于 滑动窗口的最大间隔(1秒)
  3. // 也就是说,我们要统计的时 距离当前时间1秒内的 小窗口的 count之和
  4. return time - windowWrap.windowStart() > intervalInMs;
  5. }

2.9.3.漏桶

上一节我们讲过,FlowSlot的限流判断最终都由TrafficShapingController接口中的canPass方法来实现。该接口有三个实现类:

  • DefaultController:快速失败,默认的方式,基于滑动时间窗口算法
  • WarmUpController:预热模式,基于滑动时间窗口算法,只不过阈值是动态的
  • RateLimiterController:排队等待模式,基于漏桶算法

因此,我们跟入默认的RateLimiterController中的canPass方法来分析:

  1. @Override
  2. public boolean canPass(Node node, int acquireCount, boolean prioritized) {
  3. // Pass when acquire count is less or equal than 0.
  4. if (acquireCount <= 0) {
  5. return true;
  6. }
  7. // 阈值小于等于 0 ,阻止请求
  8. if (count <= 0) {
  9. return false;
  10. }
  11. // 获取当前时间
  12. long currentTime = TimeUtil.currentTimeMillis();
  13. // 计算两次请求之间允许的最小时间间隔
  14. long costTime = Math.round(1.0 * (acquireCount) / count * 1000);
  15. // 计算本次请求 允许执行的时间点 = 最近一次请求的可执行时间 + 两次请求的最小间隔
  16. long expectedTime = costTime + latestPassedTime.get();
  17. // 如果允许执行的时间点小于当前时间,说明可以立即执行
  18. if (expectedTime <= currentTime) {
  19. // 更新上一次的请求的执行时间
  20. latestPassedTime.set(currentTime);
  21. return true;
  22. } else {
  23. // 不能立即执行,需要计算 预期等待时长
  24. // 预期等待时长 = 两次请求的最小间隔 +最近一次请求的可执行时间 - 当前时间
  25. long waitTime = costTime + latestPassedTime.get() - TimeUtil.currentTimeMillis();
  26. // 如果预期等待时间超出阈值,则拒绝请求
  27. if (waitTime > maxQueueingTimeMs) {
  28. return false;
  29. } else {
  30. // 预期等待时间小于阈值,更新最近一次请求的可执行时间,加上costTime
  31. long oldTime = latestPassedTime.addAndGet(costTime);
  32. try {
  33. // 保险起见,再判断一次预期等待时间,是否超过阈值
  34. waitTime = oldTime - TimeUtil.currentTimeMillis();
  35. if (waitTime > maxQueueingTimeMs) {
  36. // 如果超过,则把刚才 加 的时间再 减回来
  37. latestPassedTime.addAndGet(-costTime);
  38. // 拒绝
  39. return false;
  40. }
  41. // in race condition waitTime may <= 0
  42. if (waitTime > 0) {
  43. // 预期等待时间在阈值范围内,休眠要等待的时间,醒来后继续执行
  44. Thread.sleep(waitTime);
  45. }
  46. return true;
  47. } catch (InterruptedException e) {
  48. }
  49. }
  50. }
  51. return false;
  52. }

与我们之前分析的漏桶算法基本一致:

Sentinel源码分析 - 图35

2.10.DegradeSlot

最后一关,就是降级规则判断了。

Sentinel的降级是基于状态机来实现的:

Sentinel源码分析 - 图36

对应的实现在DegradeSlot类中,核心API:

  1. @Override
  2. public void entry(Context context, ResourceWrapper resourceWrapper, DefaultNode node,
  3. int count, boolean prioritized, Object... args) throws Throwable {
  4. // 熔断降级规则判断
  5. performChecking(context, resourceWrapper);
  6. // 继续下一个slot
  7. fireEntry(context, resourceWrapper, node, count, prioritized, args);
  8. }

继续进入performChecking方法:

  1. void performChecking(Context context, ResourceWrapper r) throws BlockException {
  2. // 获取当前资源上的所有的断路器 CircuitBreaker
  3. List<CircuitBreaker> circuitBreakers = DegradeRuleManager.getCircuitBreakers(r.getName());
  4. if (circuitBreakers == null || circuitBreakers.isEmpty()) {
  5. return;
  6. }
  7. for (CircuitBreaker cb : circuitBreakers) {
  8. // 遍历断路器,逐个判断
  9. if (!cb.tryPass(context)) {
  10. throw new DegradeException(cb.getRule().getLimitApp(), cb.getRule());
  11. }
  12. }
  13. }

2.10.1.CircuitBreaker

我们进入CircuitBreaker的tryPass方法中:

  1. @Override
  2. public boolean tryPass(Context context) {
  3. // 判断状态机状态
  4. if (currentState.get() == State.CLOSED) {
  5. // 如果是closed状态,直接放行
  6. return true;
  7. }
  8. if (currentState.get() == State.OPEN) {
  9. // 如果是OPEN状态,断路器打开
  10. // 继续判断OPEN时间窗是否结束,如果是则把状态从OPEN切换到 HALF_OPEN,返回true
  11. return retryTimeoutArrived() && fromOpenToHalfOpen(context);
  12. }
  13. // OPEN状态,并且时间窗未到,返回false
  14. return false;
  15. }

有关时间窗的判断在retryTimeoutArrived()方法:

  1. protected boolean retryTimeoutArrived() {
  2. // 当前时间 大于 下一次 HalfOpen的重试时间
  3. return TimeUtil.currentTimeMillis() >= nextRetryTimestamp;
  4. }

OPEN到HALF_OPEN切换在fromOpenToHalfOpen(context)方法:

  1. protected boolean fromOpenToHalfOpen(Context context) {
  2. // 基于CAS修改状态,从 OPEN到 HALF_OPEN
  3. if (currentState.compareAndSet(State.OPEN, State.HALF_OPEN)) {
  4. // 状态变更的事件通知
  5. notifyObservers(State.OPEN, State.HALF_OPEN, null);
  6. // 得到当前资源
  7. Entry entry = context.getCurEntry();
  8. // 给资源设置监听器,在资源Entry销毁时(资源业务执行完毕时)触发
  9. entry.whenTerminate(new BiConsumer<Context, Entry>() {
  10. @Override
  11. public void accept(Context context, Entry entry) {
  12. // 判断 资源业务是否异常
  13. if (entry.getBlockError() != null) {
  14. // 如果异常,则再次进入OPEN状态
  15. currentState.compareAndSet(State.HALF_OPEN, State.OPEN);
  16. notifyObservers(State.HALF_OPEN, State.OPEN, 1.0d);
  17. }
  18. }
  19. });
  20. return true;
  21. }
  22. return false;
  23. }

这里出现了从OPEN到HALF_OPEN、从HALF_OPEN到OPEN的变化,但是还有几个没有:

  • 从CLOSED到OPEN
  • 从HALF_OPEN到CLOSED

2.10.2.触发断路器

请求经过所有插槽 后,一定会执行exit方法,而在DegradeSlot的exit方法中:

Sentinel源码分析 - 图37

会调用CircuitBreaker的onRequestComplete方法。而CircuitBreaker有两个实现:

Sentinel源码分析 - 图38

我们这里以异常比例熔断为例来看,进入ExceptionCircuitBreakeronRequestComplete方法:

  1. @Override
  2. public void onRequestComplete(Context context) {
  3. // 获取资源 Entry
  4. Entry entry = context.getCurEntry();
  5. if (entry == null) {
  6. return;
  7. }
  8. // 尝试获取 资源中的 异常
  9. Throwable error = entry.getError();
  10. // 获取计数器,同样采用了滑动窗口来计数
  11. SimpleErrorCounter counter = stat.currentWindow().value();
  12. if (error != null) {
  13. // 如果出现异常,则 error计数器 +1
  14. counter.getErrorCount().add(1);
  15. }
  16. // 不管是否出现异常,total计数器 +1
  17. counter.getTotalCount().add(1);
  18. // 判断异常比例是否超出阈值
  19. handleStateChangeWhenThresholdExceeded(error);
  20. }

来看阈值判断的方法:

  1. private void handleStateChangeWhenThresholdExceeded(Throwable error) {
  2. // 如果当前已经是OPEN状态,不做处理
  3. if (currentState.get() == State.OPEN) {
  4. return;
  5. }
  6. // 如果已经是 HALF_OPEN 状态,判断是否需求切换状态
  7. if (currentState.get() == State.HALF_OPEN) {
  8. if (error == null) {
  9. // 没有异常,则从 HALF_OPEN 到 CLOSED
  10. fromHalfOpenToClose();
  11. } else {
  12. // 有一次,再次进入OPEN
  13. fromHalfOpenToOpen(1.0d);
  14. }
  15. return;
  16. }
  17. // 说明当前是CLOSE状态,需要判断是否触发阈值
  18. List<SimpleErrorCounter> counters = stat.values();
  19. long errCount = 0;
  20. long totalCount = 0;
  21. // 累加计算 异常请求数量、总请求数量
  22. for (SimpleErrorCounter counter : counters) {
  23. errCount += counter.errorCount.sum();
  24. totalCount += counter.totalCount.sum();
  25. }
  26. // 如果总请求数量未达到阈值,什么都不做
  27. if (totalCount < minRequestAmount) {
  28. return;
  29. }
  30. double curCount = errCount;
  31. if (strategy == DEGRADE_GRADE_EXCEPTION_RATIO) {
  32. // 计算请求的异常比例
  33. curCount = errCount * 1.0d / totalCount;
  34. }
  35. // 如果比例超过阈值,切换到 OPEN
  36. if (curCount > threshold) {
  37. transformToOpen(curCount);
  38. }
  39. }