雪崩问题:微服务之间相互调用,当调用链中的一个服务出现故障时,引起整个链路都无法访问的情况。
解决雪崩问题的常见方式:
避免因瞬间高并发流量而导致服务故障时:
①流量控制:限制业务访问的QPS,避免服务因流量的突增而故障。
避免因服务故障引起的雪崩问题:
②超时处理:设定超时时间,请求超过一定时间没有响应就返回错误信息,不会无休止等待
③线程隔离:限定每个业务能使用的线程数,避免耗尽整个tomcat的资源
④熔断降级:由断路器统计业务执行的异常比例,如果超出阈值则会熔断该业务,拦截访问该业务的一切请求
Sentinel介绍和安装:
Sentinel是阿里巴巴开源的一款微服务流量控制组件。官网地址:https://sentinelguard.io/zh-cn/index.html
Sentinel 具有以下特征:
•丰富的应用场景:Sentinel 承接了阿里巴巴近 10 年的双十一大促流量的核心场景,例如秒杀(即突发流量控制在系统容量可以承受的范围)、消息削峰填谷、集群流量控制、实时熔断下游不可用应用等。
•完备的实时监控:Sentinel 同时提供实时的监控功能。您可以在控制台中看到接入应用的单台机器秒级数据,甚至 500 台以下规模的集群的汇总运行情况。
•广泛的开源生态:Sentinel 提供开箱即用的与其它开源框架/库的整合模块,例如与 Spring Cloud、Dubbo、gRPC 的整合。您只需要引入相应的依赖并进行简单的配置即可快速地接入 Sentinel。
•完善的SPI扩展点:Sentinel 提供简单易用、完善的 SPI 扩展接口。您可以通过实现扩展接口来快速地定制逻辑。例如定制规则管理、适配动态数据源等。
sentinel官方提供了UI控制台,方便我们对系统做限流设置,官网地址:🔗GitHub
dos启动命令:java -jar sentinel-dashboard-1.8.1.jar
dos带修改的启动命令:java -Dserver.port=8090 -jar sentinel-dashboard-1.8.1.jar(可以带多个-D条件)
docker运行命令:docker run —name sentinel -d -p 8858:8858 bladex/sentinel-dashboard:1.8.1
微服务整合Sentinel:
Ⅰ:在服务调用者的pom文件中引入依赖
<!--sentinel-->
<dependency>
<groupId>com.alibaba.cloud</groupId>
<artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
</dependency>
Ⅱ:配置控制台,修改application.yaml文件
server:
port: 8088
spring:
cloud:
sentinel:
transport:
dashboard: localhost:8080
Ⅲ:访问服务调用者任意端点(controller层的接口),触发sentinel的监控。
流量控制:
簇点链路:
当请求进入微服务时,首先会访问DispatcherServlet,然后进入Controller、Service、Mapper,这样的一个调用链就叫做簇点链路。簇点链路中被监控的每一个接口就是一个资源。
默认情况下sentinel会监控SpringMVC的每一个端点(Endpoint,也就是controller中的方法),因此SpringMVC的每一个端点(Endpoint)就是调用链路中的一个资源。
流控模式:
直接:统计当前资源的请求,触发阈值时对当前资源直接限流,也是默认的模式
关联:统计与当前资源相关的另一个资源,触发阈值时,对当前资源限流(适用于竞争关系)
【比如用户支付时需要修改订单状态,同时用户要查询订单。查询和修改操作会争抢数据库锁,产生竞争。业务需求是优先支付和更新订单的业务,因此当修改订单业务触发阈值时,需要对查询订单业务限流。】
链路:统计从指定链路访问到本资源的请求,触发阈值时,对指定链路限流
流控效果:
流控效果是指请求达到流控阈值时应该采取的措施,包括三种:
快速失败:达到阈值后,新的请求会被立即拒绝并抛出FlowException异常。是默认的处理方式。
warm up(预热模式):对超出阈值的请求同样是拒绝并抛出异常。但这种模式阈值会动态变化,从一个较小值逐渐增加到最大阈值。
排队等待:让所有的请求按照先后次序排队执行,两个请求的间隔不能小于指定时长、
热点参数限流:分别统计参数值相同的请求,判断是否超过QPS阈值。
配置:
示例:
隔离和降级:
虽然限流可以尽量避免因高并发而引起的服务故障,但服务还会因为其它原因而故障。而要将这些故障控制在一定范围,避免雪崩,就要靠线程隔离(舱壁模式)和熔断降级手段了。
不管是线程隔离还是熔断降级,都是对客户端(调用方)的保护。
Feign整合Sentinel:
Ⅰ:修改OrderService的application.yml文件,开启Feign的Sentinel功能
feign:
sentinel:
enabled: true # 开启feign对sentinel的支持
Ⅱ:编写失败降级逻辑
①方式一:FallbackClass,无法对远程调用的异常做处理
②方式二:FallbackFactory工厂类,可以对远程调用的异常做处理
1.在feing-api项目中定义类,实现FallbackFactory
package cn.itcast.feign.clients.fallback;
import cn.itcast.feign.clients.UserClient;
import cn.itcast.feign.pojo.User;
import feign.hystrix.FallbackFactory;
import lombok.extern.slf4j.Slf4j;
@Slf4j
public class UserClientFallbackFactory implements FallbackFactory<UserClient> {
@Override
public UserClient create(Throwable throwable) {
return new UserClient() {
@Override
public User findById(Long id) {
log.error("查询用户异常", throwable);
return new User();
}
};
}
}
2.在feing-api项目中的DefaultFeignConfiguration类中将UserClientFallbackFactory注册为一个Bean
@Bean
public UserClientFallbackFactory userClientFallbackFactory(){
return new UserClientFallbackFactory();
}
3.在feing-api项目中的UserClient接口中使用UserClientFallbackFactory
import cn.itcast.feign.clients.fallback.UserClientFallbackFactory;
import cn.itcast.feign.pojo.User;
import org.springframework.cloud.openfeign.FeignClient;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
@FeignClient(value = "userservice", fallbackFactory = UserClientFallbackFactory.class)
public interface UserClient {
@GetMapping("/user/{id}")
User findById(@PathVariable("id") Long id);
}
线程隔离(舱壁模式):
两种方式实现:
- 线程池隔离 :给每个服务调用业务分配一个线程池,利用线程池本身实现隔离效果
基于计数器模式,简单,开销小
- 信号量隔离(Sentinel默认采用) :不创建线程池,而是计数器模式,记录业务使用的线程数量,达到信号量上限时,禁止新的请求。
基于线程池模式,有额外开销,但隔离控制更强
sentinel的线程隔离:
熔断降级:
由断路器统计服务调用的异常比例、慢请求比例,如果超出阈值则会熔断该服务。即拦截访问该服务的一切请求;而当服务恢复时,断路器会放行访问该服务的请求。
断路器控制熔断和放行是通过状态机来完成的
状态机包括三个状态:
- closed:关闭状态,断路器放行所有请求,并开始统计异常比例、慢请求比例。超过阈值则切换到open状态
- open:打开状态,服务调用被熔断,访问被熔断服务的请求会被拒绝,快速失败,直接走降级逻辑。Open状态5秒后会进入half-open状态
- half-open:半开状态,放行一次请求,根据执行结果来判断接下来的操作。
- 请求成功:则切换到closed状态
- 请求失败:则切换到open状态
断路器熔断策略有三种:慢调用、异常比例、异常数
慢调用:业务的响应时长(RT)大于指定时长的请求认定为慢调用请求。在指定时间内,如果请求数量超过设定的最小数量,慢调用比例大于设定的阈值,则触发熔断。
异常比例或异常数:统计指定时间内的调用,如果调用次数超过指定请求数,并且出现异常的比例达到设定的比例阈值(或超过指定异常数),则触发熔断。
授权规则:对请求方来源做判断和控制。
- 白名单:来源(origin)在白名单内的调用者允许访问
- 黑名单:来源(origin)在黑名单内的调用者不允许访问
给网关添加请求头:
让所有从gateway路由到微服务的请求都带上origin头。
这个需要利用之前学习的一个GatewayFilter来实现,AddRequestHeaderGatewayFilter。
修改gateway服务中的application.yml,添加一个defaultFilter:
spring:
cloud:
gateway:
default-filters:
- AddRequestHeader=origin,gateway
routes:
# …略
自定义异常结果:
要自定义异常时的返回结果,需要实现BlockExceptionHandler接口
public interface BlockExceptionHandler {
/**
* 处理请求被限流、降级、授权拦截时抛出的异常:BlockException
*/
void handle(HttpServletRequest request, HttpServletResponse response, BlockException e) throws Exception;
}
这个方法有三个参数:<br />HttpServletRequest request:request对象<br />HttpServletResponse response:response对象<br />BlockException e:被sentinel拦截时抛出的异常<br />![image.png](https://cdn.nlark.com/yuque/0/2022/png/26575512/1656167281925-46082e5f-7866-42c7-b8f0-994eaed62f02.png#clientId=u046a1309-5a52-4&crop=0&crop=0&crop=1&crop=1&from=paste&height=139&id=uc6cac6d4&margin=%5Bobject%20Object%5D&name=image.png&originHeight=277&originWidth=883&originalType=binary&ratio=1&rotation=0&showTitle=false&size=28662&status=done&style=none&taskId=ubf05bd43-2b2f-46f7-b907-20a6f3b457f&title=&width=441.5)<br />在order-service定义一个自定义异常处理类:
package cn.itcast.order.config;
import com.alibaba.csp.sentinel.adapter.spring.webmvc.callback.BlockExceptionHandler;
import com.alibaba.csp.sentinel.slots.block.BlockException;
import com.alibaba.csp.sentinel.slots.block.authority.AuthorityException;
import com.alibaba.csp.sentinel.slots.block.degrade.DegradeException;
import com.alibaba.csp.sentinel.slots.block.flow.FlowException;
import com.alibaba.csp.sentinel.slots.block.flow.param.ParamFlowException;
import com.alibaba.fastjson.JSON;
import org.springframework.stereotype.Component;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.util.HashMap;
import java.util.Map;
@Component
public class SentinelExceptionHandler implements BlockExceptionHandler {
@Override
public void handle(HttpServletRequest request, HttpServletResponse response, BlockException e) throws Exception {
String msg = "未知异常";
int status = 429;
if (e instanceof FlowException) {
msg = "请求被限流了";
} else if (e instanceof ParamFlowException) {
msg = "请求被热点参数限流";
} else if (e instanceof DegradeException) {
msg = "请求被降级了";
} else if (e instanceof AuthorityException) {
msg = "没有权限访问";
status = 401;
}
Map map = new HashMap<>();
map.put("msg",msg);
map.put("status",status);
response.setContentType("application/json;charset=utf-8");
response.setStatus(status);
response.getWriter().println(JSON.toJSONString(map));
}
}
规则持久化:
规则是否能持久化,取决于规则管理模式,sentinel支持三种规则管理模式
- 原始模式:Sentinel的默认模式,将规则保存在内存,重启服务会丢失。
- pull模式:控制台将配置的规则推送到Sentinel客户端,而客户端会将配置规则保存在本地文件或数据库中。以后会定时去本地文件或数据库中查询,更新本地规则。
- push模式:控制台将配置规则推送到远程配置中心,例如Nacos。Sentinel客户端监听Nacos,获取配置变更的推送消息,完成本地配置更新。🔗sentinel规则持久化.md