通过之前的N篇博文介绍,实际上我们已经能够通过使用它们搭建起一个基础的微服务架构系统来实现我们的业务需求了。但是,随着业务的发展,我们的系统规模也会变得越来越大,各微服务间的调用关系也变得越来越错综复杂。通常一个由客户端发起的请求在后端系统中会经过多个不同的微服务调用来协同产生最后的请求结果,在复杂的微服务架构系统中,几乎每一个前端请求都会形成一条复杂的分布式服务调用链路,在每条链路中任何一个依赖服务出现延迟过高或错误的时候都有可能引起请求最后的失败。这时候对于每个请求全链路调用的跟踪就变得越来越重要,通过实现对请求调用的跟踪可以帮助我们快速的发现错误根源以及监控分析每条请求链路上的性能瓶颈等好处。
针对上面所述的分布式服务跟踪问题,Spring Cloud Sleuth提供了一套完整的解决方案。在本章中,我们将详细介绍如何使用Spring Cloud Sleuth来为我们的微服务架构增加分布式服务跟踪的能力。

快速入门

在介绍各种概念与原理之前,我们先通过实现一个简单的示例,对存在服务调用的应用增加一些sleuth的配置实现基本的服务跟踪功能,以此来对Spring Cloud Sleuth有一个初步的了解,随后再逐步展开介绍实现过程中的各个细节部分。

  • 服务注册中心:nacos-server,这里不做赘述,直接使用之前构建的工程。下面的例子使用该注册中心。
  • 微服务应用:trace-1,实现一个REST接口/trace-1,调用该接口后将触发对trace-2应用的调用。具体实现如下:

    • 创建一个基础的Spring Boot应用,在pom.xml中增加下面依赖:
      1. <dependencies>
      2. <dependency>
      3. <groupId>org.springframework.boot</groupId>
      4. <artifactId>spring-boot-starter-web</artifactId>
      5. </dependency>
      6. <dependency>
      7. <groupId>org.springframework.cloud</groupId>
      8. <artifactId>spring-cloud-starter-sleuth</artifactId>
      9. </dependency>
      10. <dependency>
      11. <groupId>org.springframework.cloud</groupId>
      12. <artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId>
      13. </dependency>
      14. </dependencies>
  • 创建应用主类,并实现/trace-1接口,并使用RestTemplate调用trace-2应用的接口。具体如下: ```java @SpringBootApplication @EnableDiscoveryClient public class TraceApplication {

    public static void main(String[] args) {

      SpringApplication.run(TraceApplication.class, args);
    

    }

    @Bean @LoadBalanced RestTemplate restTemplate() {

      return new RestTemplate();
    

    }

@RestController
@Slf4j
static class TestController {

    @Autowired
    RestTemplate restTemplate;

    @GetMapping("/trace-1")
    public String hello() {
        log.info("   trace - 1    ");
        return restTemplate.getForEntity("http://trace-2/trace-2", String.class).getBody();
    }
}

}


- application.properties中配置nacos服务地址(使用其他注册中心(eureka, apollo)只需要修改注册中心地址配置地址即可),具体如下:

spring.application.name=trace-1 server.port=9101

eureka

eureka.client.serviceUrl.defaultZone=

nacos

spring.cloud.nacos.discovery.server-addr=localhost:8848


- 微服务应用:trace-2,实现一个REST接口/trace-2,供trace-1调用。具体实现如下:
   - 创建一个基础的Spring Boot应用,pom.xml中的依赖与trace-1相同
   - 创建应用主类,并实现/trace-2接口,具体实现如下:
```java
@SpringBootApplication
@EnableDiscoveryClient
public class Trace2Application {

    public static void main(String[] args) {
        SpringApplication.run(Trace2Application.class, args);
    }

    @RestController
    @Slf4j
    static class TestController {

        @GetMapping("/trace-2")
        public String hello() {
            log.info("   trace - 2   ");
            return " trace - 2 ";
        }
    }
}

2021-07-12 13:54:07.873 INFO [trace-2,3a469d5981a6844c,844a1a3e9d9087e2,false] 20120 —- [nio-9002-exec-5] c.snow.Trace2Application$TestController : trace - 2

``` 从上面的控制台输出内容中,我们可以看到多了一些形如[trace-1,3a469d5981a6844c,3a469d5981a6844c,false]的日志信息,而这些元素正是实现分布式服务跟踪的重要组成部分,它们每个值的含义如下:

  • 第一个值:trace-1,它记录了应用的名称,也就是application.properties中spring.application.name参数配置的属性。
  • 第二个值:3a469d5981a6844c,Spring Cloud Sleuth生成的一个ID,称为Trace ID,它用来标识一条请求链路。一条请求链路中包含一个Trace ID,多个Span ID。
  • 第三个值:3a469d5981a6844c,Spring Cloud Sleuth生成的另外一个ID,称为Span ID,它表示一个基本的工作单元,比如:发送一个HTTP请求。
  • 第四个值:false,表示是否要将该信息输出到Zipkin等服务中来收集和展示。

上面四个值中的Trace ID和Span ID是Spring Cloud Sleuth实现分布式服务跟踪的核心。在一次服务请求链路的调用过程中,会保持并传递同一个Trace ID,从而将整个分布于不同微服务进程中的请求跟踪信息串联起来,以上面输出内容为例,trace-1和trace-2同属于一个前端服务请求来源,所以他们的Trace ID是相同的,处于同一条请求链路中。