术语
Span:基本工作单元,例如,在一个新建的span中发送一个RPC等同于发送一个回应请求给RPC,span通过一个64位ID唯一标识,trace以另一个64位ID表示,span还有其他数据信息,比如摘要、时间戳事件、关键值注释(tags)、span的ID、以及进度ID(通常是IP地址) span在不断的启动和停止,同时记录了时间信息,当你创建了一个span,你必须在未来的某个时刻停止它。
Trace:一系列spans组成的一个树状结构,例如,如果你正在跑一个分布式工程,你可能需要创建一个trace。
Annotation:用来及时记录一个事件的存在,一些核心annotations用来定义一个请求的开始和结束
cs - Client Sent -客户端发起一个请求,这个annotion描述了这个span的开始
sr - Server Received -服务端获得请求并准备开始处理它,如果将其sr减去cs时间戳便可得到网络延迟
ss - Server Sent -注解表明请求处理的完成(当请求返回客户端),如果ss减去sr时间戳便可得到服务端需要的处理请求时间
cr - Client Received -表明span的结束,客户端成功接收到服务端的回复,如果cr减去cs时间戳便可得到客户端从服务端获取回复的所有所需时间
整合zipkin使用
zipkin服务
docker run -d -p 9411:9411 openzipkin/zipkin
引入依赖
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-sleuth</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-zipkin</artifactId>
</dependency>
添加配置
# 指定Zipkin server地址
spring.zipkin.baseUrl=http://192.168.2.252:9411
# 送跟踪数据到zipkin的类型web(http)
spring.zipkin.sender.type=web
# request采样的数量 默认是0.1 也即是10%,即采样10%的请求数据;
#因为在分布式系统中,数据量可能会非常大,因此采样非常重要我们示例数据少最好配置为1全采样,100%的采集会稍微影响一点性能
spring.sleuth.sampler.probability=1.0
数据持久化
整合es
docker run \
--name zipkin-server -d \
-p 9411:9411 \
--restart=always \
-e STORAGE_TYPE=elasticsearch \
-e ES_HOSTS=192.168.2.252:9200 openzipkin/zipkin
如果是连接ES集群,--ES_HOSTS
通过逗号分割,比如:--ES_HOSTS=http://1.1.1.1:9200,http://2.2.2.2:9200
参数
环境变量 | 描述 |
---|---|
ES_HOSTS | 连接ES地址,多个由, 分隔。默认为http://localhost:9200 |
ES_PIPELINE | 指定span被索引之前的pipeline |
ES_TIMEOUT | 连接ES的超时时间,单位ms 。默认10000(10S) |
ES_INDEX | Zipkin持久化所使用的索引。默认zipkin |
ES_DATE_SEPARATOR | Zipkin建立索引的日期分隔符。默认为- |
ES_INDEX_SHARDS | 分片(shard)个数,默认5个 |
ES_INDEX_REPLICAS | 副本(replica)个数,默认1个 |
ES_HTTP_LOGGING | ES的日志级别,BASIC, HEADERS, BODY |
ES_USERNAME/ES_PASSWORD | 登录ES的用户名和密码 |