OpenTracing

OpenTracing 是 CNCF 提出的分布式追踪的标准,它提供用厂商中立的 API,并提供 Go、Java、JavaScript、Python、Ruby、PHP、Objective-C、C++ 和 C# 这九种语言的库。

目前支持 Tracer 包括 Zipkin、Skywalking、Jaeger 等,支持的框架包括 gRPC、MOTAN、django、Flask、Sharding-JDBC 等,详见 OpenTracing 官网

Jaeger 是遵循 OpenTracing 的一种实现。

Jaeger UI
图片 - Jaeger UI

关于 OpenTracing 的详细约定请参考:

基本术语

如下是 OpenTracing 中定义的基本术语。

Trace

Trace 通常指一次完整的调用链。如上文中的 Jaeger UI 截图就是 Istio 官方提供的 Bookinfo 示例 的追踪中对 productpage 的调用链分析。

Span

每个 trace 都由一系列 Span 组成,一个 span 可以理解为两个微服务之间的调用,如同 Chrome 检查器中查看网络访问瀑布一样。

Chrome Inspector
图片 - Chrome Inspector

根据 OpenTracing 的规格约定,每个 Span 都要包含以下状态:

  • 操作名称:可以是访问的一个 URL。必填。例如 localhost:8808/
  • 起/止时间戳:也可以使用起始时间和持续时间来表示。必填。例如 1540273832696773
  • Tags:一组键值对集合,Semantic Conventions 有一些常用约定。必填。例如 http.protocol
  • Logs:一组键值对集合,用于记录调用日志。可选填。
  • SpanContext:在进程间通信时携带的 span 信息,指整个 trace。

示例

下面是 Jaeger 收集的来自 Bookinfo 示例 中的 productpage 的调用链追踪数据。

{
    "data": [
        {
            "traceID": "aaccbe962478cf93",
            "spans": [
                {
                    "traceID": "aaccbe962478cf93",
                    "spanID": "fa36a9cbd60b4ae5",
                    "operationName": "details.default.svc.cluster.local:9080/*",
                    "references": [
                        {
                            "refType": "CHILD_OF",
                            "traceID": "aaccbe962478cf93",
                            "spanID": "2"
                        }
                    ],
                    "startTime": 1540273832696773,
                    "duration": 8171,
                    "tags": [
                        {
                            "key": "component",
                            "type": "string",
                            "value": "proxy"
                        },
                        {
                            "key": "node_id",
                            "type": "string",
                            "value": "sidecar~172.33.5.11~productpage-v1-8584c875d8-4jgwg.default~default.svc.cluster.local"
                        }
                        ...
                    ],
                    "logs": [],
                    "processID": "p1",
                    "warnings": null
                },
                ...
            ],
            "processes": {
                "p1": {
                    "serviceName": "productpage",
                    "tags": [
                        {
                            "key": "ip",
                            "type": "string",
                            "value": "172.33.5.11"
                        }
                    ]
                },
                ...
            },
            "warnings": null
        }
    ],
    "total": 0,
    "limit": 0,
    "offset": 0,
    "errors": null
}

在开发应用时需要使用兼容 OpenTracing API 的 Tracing 实现库,例如 Jaeger 来实现自动的分布式追踪。

参考

results matching ""

    No results matching ""