介绍

简介

ZipKin 是一个开放源代码的分布式跟踪系统,由 Twitter 公司开源,它致力于收集服务的
定时数据,以解决微服务架构中的延迟问题,包括数据的收集、
存储、查找和展现。它的理论模型来自于 Google Dapper 论文。

每个服务向 ZipKin 报告计时数据,ZipKin 会根据调用关系通过 ZipKin UI 生成依赖关系
图,显示了多少跟踪请求通过每个服务,该系统让开发者可通
过一个 Web 前端轻松的收集和分析数据,例如用户每次请求服务的处理时间等,可方便的
监测系统中存在的瓶颈。

服务追踪说明

微服务架构是通过业务来划分服务的,使用 REST 调用。对外暴露的一个接口,可能需要很
多个服务协同才能完成这个接口功能,如果链路上任何一个服务
出现问题或者网络超时,都会形成导致接口调用失败。随着业务的不断扩张,服务之间互相
调用会越来越复杂。

zipkin_service_call.png

随着服务的越来越多,对调用链的分析会越来越复杂。它们之间的调用关系也许如下:

zipkin_service_trace.png

术语解释

  • Span:基本工作单元,例如,在一个新建的 Span 中发送一个 RPC 等同于发送一个回应请
    求给 RPC,Span 通过一个 64 位 ID 唯一标识,Trace 以另一个 64 位 ID 表示。
  • Trace:一系列 Spans 组成的一个树状结构,例如,如果你正在运行一个分布式大数据工程
    ,你可能需要创建一个 Trace。
  • Annotation:用来即使记录一个事件的存在,一些核心 Annotations 用来定义一个请求的
    开始和结束
    • cs:Client Sent,客户端发起一个请求,这个 Annotation 描述了这个 Span 的开始
    • sr:Server Received,服务端获得请求并准备开始处理它,如果将其 sr 减去 cs 时间戳便可得到网络延迟
    • ss:Server Sent 表明请求处理的完成(当请求返回客户端),如果 ss 减去 sr 时间戳便可得到服务端需要的处理请求时间
    • cr:Client Received 表明 Span 的结束,客户端成功接收到服务端的回复,如果 cr 减去 cs 时间戳便可得到客户端从服务端获取回复的所有所需时间

将 Span 和 Trace 在一个系统中使用 Zipkin 注解的过程图形化:

zipkin_structure.png

下载安装

在 Spring Boot 2.0 版本之后,官方已不推荐自己搭建定制了,而是直接提供了编译好的 jar 包。
详情可以查看官网:https://zipkin.io/pages/quickstart.html

启动服务

环境要求 JDK 8 以上

Java程序启动

  • 注意:zipkin官网已经提供定制了,使用官方jar运行即可。
  • 默认端口号启动zipkin服务
    curl -sSL https://zipkin.io/quickstart.sh | bash -s
    java –jar zipkin.jar
    • 默认端口号; 9411
  • 指定端口号启动
    java -jar zipkin.jar --server.port=8080

Docker 启动

docker run -d -p 9411:9411 openzipkin/zipkin

功能使用

对接RabbitMQ和Elasticsearch

  1. java -jar zipkin.jar --RABBIT_URI=amqp://rabbit:123456@10.0.90.35:5672/vhost --STORAGE_TYPE=elasticsearch --ES_HOSTS=http//:localhost:9200 --ES_HTTP_LOGGING=BASIC

常见问题

参考资料