分布式系统面临的问题
**
复杂分布式体系结构中的应用程序有数十个依赖关系,每个依赖关系在某些时候将不可避免失败!

8.1 服务雪崩

多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服务B和微服务C又调用其他的微服务,这就是所谓的“扇出”,如果扇出的链路上某个微服务的调用响应时间过长,或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的“雪崩效应”。

对于高流量的应用来说,单一的后端依赖可能会导致所有服务器上的所有资源都在几十秒内饱和。比失败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张,导致整个系统发生更多的级联故障,这些都表示需要对故障和延迟进行隔离和管理,以便单个依赖关系的失败,不能取消整个应用程序或系统。

我们需要,弃车保帅
**

8.2 什么是Hystrix?

Hystrix是一个应用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免的会调用失败,比如超时,异常等,Hystrix能够保证在一个依赖出问题的情况下,不会导致整个体系服务失败,避免级联故障,以提高分布式系统的弹性。

“断路器”本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控 (类似熔断保险丝) ,向调用方方茴一个服务预期的,可处理的备选响应 (FallBack) ,而不是长时间的等待或者抛出调用方法无法处理的异常,这样就可以保证了服务调用方的线程不会被长时间,不必要的占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。

8.3 Hystrix能干嘛?

  • 服务降级
  • 服务熔断
  • 服务限流
  • 接近实时的监控

当一切正常时,请求流可以如下所示:

1.jpg

当许多后端系统中有一个潜在时,它可以阻止整个用户请求:

image.png

随着大容量通信量的增加,单个后端依赖项的潜在性会导致所有服务器上的所有资源在几秒钟内饱和。

应用程序中通过网络或客户端库可能导致网络请求的每个点都是潜在故障的来源。比失败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,从而备份队列、线程和其他系统资源,从而导致更多跨系统的级联故障。
image.png
image.png

当使用hystrix包装每个基础依赖项时,上面的图表中所示的体系结构会发生类似于以下关系图的变化。每个依赖项是相互隔离的,限制在延迟发生时它可以填充的资源中,并包含在回退逻辑中,该逻辑决定在依赖项中发生任何类型的故障时要做出什么样的响应:

image.png

官网资料https://github.com/Netflix/Hystrix/wiki,图片加载不出来请看另一篇文章 github加载图片失败问题

8.4 服务熔断

8.4.1 什么是服务熔断

**

熔断机制是赌赢雪崩效应的一种微服务链路保护机制。

在微服务架构中,微服务之间的数据交互通过远程调用完成,微服务A调用微服务B和微服务C,微服务B和微服务C又调用其它的微服务,此时如果链路上某个微服务的调用响应时间过长或者不可用,那么对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,导致“雪崩效应”。

服务熔断是应对雪崩效应的一种微服务链路保护机制。例如在高压电路中,如果某个地方的电压过高,熔断器就会熔断,对电路进行保护。同样,在微服务架构中,熔断机制也是起着类似的作用。当调用链路的某个微服务不可用或者响应时间太长时,会进行服务熔断,不再有该节点微服务的调用,快速返回错误的响应信息。当检测到该节点微服务调用响应正常后,恢复调用链路。

当扇出链路的某个微服务不可用或者响应时间太长时,会进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息。检测到该节点微服务调用响应正常后恢复调用链路。在SpringCloud框架里熔断机制通过Hystrix实现。Hystrix会监控微服务间调用的状况,当失败的调用到一定阀值缺省是5秒内20次调用失败,就会启动熔断机制。熔断机制的注解是:@HystrixCommand

服务熔断解决如下问题:

  • 当所依赖的对象不稳定时,能够起到快速失败的目的
  • 快速失败后,能够根据一定的算法动态试探所依赖对象是否恢复

8.4.2 入门案例

新建springcloud-provider-dept-hystrix-8081模块并拷贝springcloud-provider-dept–8081内的pom.xml、resource和Java代码进行初始化并调整。

  • 导入hystrix依赖

**

  1. <dependencies>
  2. <!--
  3. 服务熔断:服务端~某个服务超时或者异常,引起熔断~,保险丝
  4. 服务降级:客户端~从网站请求的负载考虑~,当某个服务熔断或者关闭之后,服务将不在被调用~
  5. 此时,客户端我们可以准备一个FallbackFactory,返回一个默认值,整体的服务水平下降了,但是,好歹能用
  6. 不直接挂掉强
  7. -->
  8. <dependency>
  9. <groupId>org.springframework.cloud</groupId>
  10. <artifactId>spring-cloud-starter-hystrix</artifactId>
  11. <version>1.4.6.RELEASE</version>
  12. </dependency>
  13. <!-- https://mvnrepository.com/artifact/org.springframework.cloud/spring-cloud-starter-eureka -->
  14. <dependency>
  15. <groupId>org.springframework.cloud</groupId>
  16. <artifactId>spring-cloud-starter-eureka</artifactId>
  17. <version>1.4.6.RELEASE</version>
  18. </dependency>
  19. <!-- 完善监控信息 -->
  20. <dependency>
  21. <groupId>org.springframework.boot</groupId>
  22. <artifactId>spring-boot-starter-actuator</artifactId>
  23. </dependency>
  24. <!-- 我们需要拿到实体类,所以要配置api module -->
  25. <dependency>
  26. <groupId>org.gmw</groupId>
  27. <artifactId>springcloud-api</artifactId>
  28. <version>1.0-SNAPSHOT</version>
  29. </dependency>
  30. <dependency>
  31. <groupId>junit</groupId>
  32. <artifactId>junit</artifactId>
  33. <scope>test</scope>
  34. </dependency>
  35. <dependency>
  36. <groupId>mysql</groupId>
  37. <artifactId>mysql-connector-java</artifactId>
  38. </dependency>
  39. <dependency>
  40. <groupId>com.alibaba</groupId>
  41. <artifactId>druid</artifactId>
  42. </dependency>
  43. <dependency>
  44. <groupId>ch.qos.logback</groupId>
  45. <artifactId>logback-core</artifactId>
  46. </dependency>
  47. <dependency>
  48. <groupId>org.mybatis.spring.boot</groupId>
  49. <artifactId>mybatis-spring-boot-starter</artifactId>
  50. </dependency>
  51. <dependency>
  52. <groupId>org.springframework.boot</groupId>
  53. <artifactId>spring-boot-test</artifactId>
  54. </dependency>
  55. <dependency>
  56. <groupId>org.springframework.boot</groupId>
  57. <artifactId>spring-boot-starter-web</artifactId>
  58. </dependency>
  59. <dependency>
  60. <groupId>org.springframework.boot</groupId>
  61. <artifactId>spring-boot-starter-jetty</artifactId>
  62. </dependency>
  63. <dependency>
  64. <groupId>org.springframework.boot</groupId>
  65. <artifactId>spring-boot-devtools</artifactId>
  66. </dependency>
  67. </dependencies>
  • 调整yml配置文件

**

  1. # Eureka的配置
  2. eureka:
  3. client:
  4. service-url:
  5. defaultZone: http://eureka7001.com:7001/eureka/,http://eureka7002.com:7002/eureka/,http://eureka7003.com:7003/eureka/
  6. instance:
  7. instance-id: springcloud-provider-dept-hystrix-8081 #修改Eureka上的默认描述信息
  8. prefer-ip-address: true #改为true后默认显示的是ip地址而不再是localhost

**

  • application.properties配置文件

**

  1. server.port=8001
  2. #mybatis配置
  3. mybatis.type-aliases-package=com.gmw.springcloud.entity
  4. mybatis.mapper-locations=classpath:mybatis/mapper/*.xml
  5. mybatis.config-location=classpath:mybatis/mybatis-config.xml
  6. #spring配置
  7. spring.application.name=springcloud-provider-dept
  8. spring.datasource.type=com.alibaba.druid.pool.DruidDataSource
  9. spring.datasource.driver-class-name=org.gjt.mm.mysql.Driver
  10. spring.datasource.url=jdbc:mysql://localhost:3306/db01?useUnicode=true&characterEncoding=utf-8
  11. spring.datasource.username=root
  12. spring.datasource.password=root
  13. #Eureka配置,服务注册到哪里
  14. eureka.client.service-url.defaultZone=http://eureka7001.com:7001/eureka/,http://eureka7002.com:7002/eureka/,http://eureka7003.com:7003/eureka/
  15. #修改Eureka上的默认描述信息
  16. eureka.instance.instance-id=springcloud-provider-dept-hystrix-8001
  17. #可以显示服务的IP地址
  18. eureka.instance.prefer-ip-address=true
  19. #info配置
  20. info.app.name=gmw-springcloud
  21. info.company=blog.gmw.com

prefer-ip-address: false:

8. Hystrix:服务熔断 - 图6

prefer-ip-address: true:

8. Hystrix:服务熔断 - 图7

  • 修改controller

**

  1. //视图Restful服务
  2. @RestController
  3. public class DeptController {
  4. @Autowired
  5. private DeptService deptService;
  6. //获取一些配置的信息,得到具体的微服务!
  7. @Autowired
  8. private DiscoveryClient client;
  9. @HystrixCommand(fallbackMethod = "hystrixGet")//如果根据id查询出现异常,走这段代码
  10. @GetMapping("/dept/get/{id}")
  11. public Dept get(@PathVariable("id") Long id) {
  12. Dept dept = deptService.queryById(id);
  13. if (dept==null){
  14. throw new RuntimeException("这个id=>"+id+",不存在该用户,或信息无法找到~");
  15. }
  16. return dept;
  17. }
  18. //根据id查询备选方案(熔断)
  19. public Dept hystrixGet(@PathVariable("id") Long id){
  20. return new Dept().setDeptno(id)
  21. .setDname("这个id=>"+id+",没有对应的信息,null---@Hystrix~")
  22. .setDb_source("在MySQL中没有这个数据库");
  23. }
  24. }
  • 为主启动类添加对熔断的支持注解@EnableCircuitBreaker

**

  1. //启动类
  2. @SpringBootApplication
  3. @EnableEurekaClient //在服务启动后自动注册到Eureka中
  4. @EnableDiscoveryClient //服务发现~
  5. @EnableCircuitBreaker//添加对熔断的支持
  6. public class DeptProviderHystrix_8081 {
  7. public static void main(String[] args) {
  8. SpringApplication.run(DeptProviderHystrix_8081.class,args);
  9. }
  10. }
  • 测试

使用熔断后,当访问一个存在的id时,前台页展示数据如下

8. Hystrix:服务熔断 - 图8

使用熔断后,当访问一个不存在的id时,前台页展示数据如下

8. Hystrix:服务熔断 - 图9

而不适用熔断的springcloud-provider-dept–8081模块访问相同地址会出现下面状况

8. Hystrix:服务熔断 - 图10

因此,为了避免因某个微服务后台出现异常或错误而导致整个应用或网页报错,使用熔断是必要的
**

8.5 服务降级

8.5.1 什么是服务降级

服务降级是指 当服务器压力剧增的情况下,根据实际业务情况及流量,对一些服务和页面有策略的不处理或换种简单的方式处理,从而释放服务器资源以保证核心业务正常运作或高效运作。说白了,就是尽可能的把系统资源让给优先级高的服务。   资源有限,而请求是无限的。如果在并发高峰期,不做服务降级处理,一方面肯定会影响整体服务的性能,严重的话可能会导致宕机某些重要的服务不可用。所以,一般在高峰期,为了保证核心功能服务的可用性,都要对某些服务降级处理。比如当双11活动时,把交易无关的服务统统降级,如查看蚂蚁深林,查看历史订单等等。

服务降级主要用于什么场景呢?当整个微服务架构整体的负载超出了预设的上限阈值或即将到来的流量预计将会超过预设的阈值时,为了保证重要或基本的服务能正常运行,可以将一些 不重要 或 不紧急 的服务或任务进行服务的 延迟使用 或 暂停使用。   降级的方式可以根据业务来,可以延迟服务,比如延迟给用户增加积分,只是放到一个缓存中,等服务平稳之后再执行 ;或者在粒度范围内关闭服务,比如关闭相关文章的推荐。

8. Hystrix:服务熔断 - 图11

由上图可得,当某一时间内服务A的访问量暴增,而B和C的访问量较少,为了缓解A服务的压力,这时候需要B和C暂时关闭一些服务功能,去承担A的部分服务,从而为A分担压力,叫做服务降级

8.5.2 服务降级需要考虑的问题

1)那些服务是核心服务,哪些服务是非核心服务
2)那些服务可以支持降级,那些服务不能支持降级,降级策略是什么
3)除服务降级之外是否存在更复杂的业务放通场景,策略是什么?

8.5.3 自动降级分类

1)超时降级:主要配置好超时时间和超时重试次数和机制,并使用异步机制探测回复情况

2)失败次数降级:主要是一些不稳定的api,当失败调用次数达到一定阀值自动降级,同样要使用异步机制探测回复情况

3)故障降级:比如要调用的远程服务挂掉了(网络故障、DNS故障、http服务返回错误的状态码、rpc服务抛出异常),则可以直接降级。降级后的处理方案有:默认值(比如库存服务挂了,返回默认现货)、兜底数据(比如广告挂了,返回提前准备好的一些静态页面)、缓存(之前暂存的一些缓存数据)

4)限流降级:秒杀或者抢购一些限购商品时,此时可能会因为访问量太大而导致系统崩溃,此时会使用限流来进行限制访问量,当达到限流阀值,后续请求会被降级;降级后的处理方案可以是:排队页面(将用户导流到排队页面等一会重试)、无货(直接告知用户没货了)、错误页(如活动太火爆了,稍后重试)。

8.5.4 入门案例

在springcloud-api模块下的service包中新建降级配置类DeptClientServiceFallBackFactory.java

  1. //降级 ~
  2. @Component
  3. public class DeptClientServiceFallBackFactory implements FallbackFactory {
  4. @Override
  5. public Object create(Throwable throwable) {
  6. return new DeptClientService() {
  7. @Override
  8. public Dept queryById(Long id) {
  9. return new Dept()
  10. .setDeptno(id)
  11. .setDname("id=>" + id + "没有对应的信息,客户端提供了降级的信息,这个服务现在已经被关闭")
  12. .setDb_source("没有数据~");
  13. }
  14. @Override
  15. public List<Dept> queryAll() {
  16. return null;
  17. }
  18. @Override
  19. public boolean addDept(Dept dept) {
  20. return false;
  21. }
  22. };
  23. }
  24. }
  • 在DeptClientService中指定降级配置类DeptClientServiceFallBackFactory


  1. @Service
  2. //@FeignClient:微服务客户端注解,value:指定微服务的名字,这样就可以使Feign客户端直接找到对应的微服务
  3. @FeignClient(value = "SPRINGCLOUD-PROVIDER-DEPT",fallbackFactory = DeptClientServiceFallBackFactory.class)
  4. public interface DeptClientService {
  5. @GetMapping("/dept/get/{id}")
  6. Dept queryById(@PathVariable("id") Long id);
  7. @GetMapping("/dept/list")
  8. List<Dept> queryAll();
  9. @PostMapping("/dept/add")
  10. boolean addDept(Dept dept);
  11. }
  • 在springcloud-consumer-dept-feign模块中开启降级


  1. # 开启降级feign.hystrix
  2. feign:
  3. hystrix:
  4. enabled: true
  • application.properties配置文件
  1. server.port=80
  2. spring.application.name=springcloud-consumer-dept
  3. #eureka配置
  4. #不向eureka注册自己
  5. eureka.client.register-with-eureka=false
  6. eureka.client.service-url.defaultZone=http://eureka7001.com:7001/eureka/,http://eureka7002.com:7002/eureka/,http://eureka7003.com:7003/eureka/
  7. #开启降级feign.hystrix
  8. feign.hystrix.enabled=true
  • 测试

**
正常访问

8. Hystrix:服务熔断 - 图12

关掉服务DeptProvider_8081继续访问

8. Hystrix:服务熔断 - 图13

8.6 服务熔断和降级的区别

  • 服务熔断—>服务端:某个服务超时或异常,引起熔断~,类似于保险丝(自我熔断)

  • 服务降级—>客户端:从整体网站请求负载考虑,当某个服务熔断或者关闭之后,服务将不再被调用,此时在客户端,我们可以准备一个 FallBackFactory ,返回一个默认的值(缺省值)。会导致整体的服务下降,但是好歹能用,比直接挂掉强。

  • 触发原因不太一样,服务熔断一般是某个服务(下游服务)故障引起,而服务降级一般是从整体负荷考虑;管理目标的层次不太一样,熔断其实是一个框架级的处理,每个微服务都需要(无层级之分),而降级一般需要对业务有层级之分(比如降级一般是从最外围服务开始)

  • 实现方式不太一样,服务降级具有代码侵入性(由控制器完成/或自动降级),熔断一般称为自我熔断

限流:限制并发的请求访问量,超过阈值则拒绝; 降级:服务分优先级,牺牲非核心服务(不可用),保证核心服务稳定;从整体负荷考虑; 熔断:依赖的下游服务故障触发熔断,避免引发本系统崩溃;系统自动执行和恢复

8.7 Dashboard 流监控

新建springcloud-consumer-hystrix-dashboard模块

  • 添加依赖

**

<dependencies>

    <!-- https://mvnrepository.com/artifact/org.springframework.cloud/spring-cloud-starter-hystrix -->
    <dependency>
        <groupId>org.springframework.cloud</groupId>
        <artifactId>spring-cloud-starter-hystrix</artifactId>
        <version>1.4.7.RELEASE</version>
    </dependency>

    <dependency>
        <groupId>org.springframework.cloud</groupId>
        <artifactId>spring-cloud-starter-hystrix-dashboard</artifactId>
        <version>1.4.7.RELEASE</version>
    </dependency>

    <!-- Ribbon -->
    <dependency>
        <groupId>org.springframework.cloud</groupId>
        <artifactId>spring-cloud-starter-ribbon</artifactId>
        <version>1.4.7.RELEASE</version>
    </dependency>

    <!--eureka-->
    <dependency>
        <groupId>org.springframework.cloud</groupId>
        <artifactId>spring-cloud-starter-eureka</artifactId>
        <version>1.4.7.RELEASE</version>
    </dependency>

    <dependency>
        <groupId>nuc.ss</groupId>
        <artifactId>springcloud-api</artifactId>
        <version>1.0-SNAPSHOT</version>
    </dependency>

    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
</dependencies>
  • application.properties配置文件
server.port=9001
  • 主启动类

**

@SpringBootApplication
@EnableHystrixDashboard //开启
public class DeptConsumerDashboard_9001 {
    public static void main(String[] args) {
        SpringApplication.run(DeptConsumerDashboard_9001.class,args);
    }
}
  • 启动应用程序,访问:localhost:9001/hystrix

8. Hystrix:服务熔断 - 图14

  • 服务端8081是否有监控应用程依赖,没有添加

**

<!--actuator完善监控信息-->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
  • 给springcloud-provider-dept-hystrix-8081模块下的主启动类添加如下代码,添加监控


//启动类
@SpringBootApplication
@EnableEurekaClient //在服务启动后自动注册到Eureka中
@EnableDiscoveryClient //服务发现~
@EnableCircuitBreaker//添加对熔断的支持
public class DeptProviderHystrix_8081 {
    public static void main(String[] args) {
        SpringApplication.run(DeptProviderHystrix_8081.class,args);
    }

    //增加一个 Servlet
    @Bean
    public ServletRegistrationBean hystrixMetricsStreamServlet(){
        ServletRegistrationBean registrationBean = new ServletRegistrationBean(new HystrixMetricsStreamServlet());
        //访问该页面就是监控页面
        registrationBean.addUrlMappings("/actuator/hystrix.stream");
        return registrationBean;
    }
}

注意:先访问localhost:8081/dept/get/1,
在访问localhost:8081/actuator/hystrix.stream,不然也会报错
**
在springcloud-consumer-hystrix-dashboard中的yml中添加配置(刚开始没加,一直报这个错: Unable to connect to Command Metric Stream)

hystrix:
  dashboard:
    proxy-stream-allow-list: "*"

8. Hystrix:服务熔断 - 图15

运行结果:(注意心跳和圆的大小变化)

8. Hystrix:服务熔断 - 图16

如何看运行结果
**

  • 七色

8. Hystrix:服务熔断 - 图17

绿色:成功数 蓝色:熔断数 浅绿色:错误请求数 黄色:超时数 紫色:线程池拒绝数 红色:失败/异常数 Hosts:服务请求频率

Circuit Closed:断路状态

  • 一圈 实心圆:公有两种含义,他通过颜色的变化代表了实例的健康程度 它的健康程度从绿色<黄色<橙色<红色 递减 该实心圆除了颜色的变化之外,它的大小也会根据实例的请求流量发生变化,流量越大,该实心圆就 越大,所以通过该实心圆的展示,就可以在大量的实例中快速发现故障实例和高压力实例

8. Hystrix:服务熔断 - 图18

8. Hystrix:服务熔断 - 图19

一线 曲线:用来记录2分钟内流量的相对变化,可以通过它来观察到流量的上升和下降趋势!

8. Hystrix:服务熔断 - 图20