混合逻辑时钟

混合逻辑时钟

本文将首先依次简单介绍分布式系统下的物理时钟（Physical Time，也称PT），逻辑时钟（Logical Clock，也称LC），向量时钟（Vector Clock，也称VC），真实时钟（True Time，也称TT）的基本概念，然后着重笔墨介绍混合逻辑时钟（Hybrid Logical Clock，也称HLC）

物理时钟-Physical Time, PT

物理时钟即机器本地的时钟，而由于设备硬件不同，本身存在偏差，一天的误差可能有毫秒甚至秒级，所以需要对不同的机器时钟进行同步使得机器的时间进行相对统一。NTP是目前比较常用的同步时间的方式，其机制为CS架构，每台机器上存在一个NTP的客户端，与NTP的服务端进行同步，校准本地的时间。关于NTP具体的设计细节本文不做详细介绍，需要知道的是，由于NTP走网络传输，势必会导致同步后的物理时钟与远程NTP服务器的时钟存在一定的偏差。

逻辑时钟-Logical Clock, LC

在分布式场景下不同机器的时间存在不一致，那么跨节点的时间无法确定先后关系，所以Lamport提出了逻辑时钟（Logical Clock）的概念，通过happened-before（hb）关系确定事件的逻辑时钟，happened-before（hb）是基于信息传递而不是时间传递来定义的。

如果事件A和事件B串行发生，且事件A在B之前发生，那么A happened before B
- A hb B
- A -> B
- C(A) <C(B)
如果事件A和事件B位于2个进程内，A是消息的发送事件，B是消息的接受事件。那么A hb B

对于捕获happened-before（hb），LC假设所有通信都发生在当前系统中，并且没有反向通道。

逻辑时钟存在的问题

逻辑时钟定义的是一个全序关系，没办法准确表示出并发关系
使用 Lamport 时间戳，只是比较事件a和b各自的时钟值，无法说明它们之间的关系，即如果 a -> b，那么 C(a) < C(b)，但是 C(a) < C(b) 并不能说明 a -> b。也就是说C(a) < C(b) 是 a -> b 的必要不充分条件，我们不能通过 Lamport 时间戳对事件 a、b 的因果关系进行判断。

在进程A中（如下图所示），我们无法知道进程B中的数据X的时钟已经高过了3，所以并不会主动让最后发生的数据更新事件A3有高于3的时间。
分布式数据库--混合逻辑时钟 - 图1
所以可以认为，因为进程无法记录其他进程内数据的时间版本，所以会造成这样的数据冲突。

假设进程B在完成B2事件后通知进程A：“进程B的数据X时钟变为了4”。那么进程A在完成A3之后就能感受到冲突。

向量时钟基于此思想，在一个进程内存储了所有其他进程的时钟备份，用于感受数据冲突

向量时钟-Vector Clock，VC

向量时钟（VC）是用来维持LC的向量化版本的。

向量时钟算法的内容：

在一个有 N 个节点的分布式数据库中，用一个 N 维的向量来表征时间，其中的某一个维表示一个节点的时间，这个时间向量按照以下规则进行处理：

所有节点的初始时间向量都是0；
每一次经历一个时间间隔，都要在各自的时间维度上加1；
每次发送数据，都要将这个向量时间作为时间戳和数据一起发出去；
每次节点收到了时间向量，都要比较该时间向量和自身时间向量，并取两者中每一维中的最大值，作为自身新的时间向量；
当收到有冲突的更改时，比较这两次更改的时间向量：若存在偏序关系，则取偏序关系中时间向量较大的对应的值，并以此作为本节点新的时间向量；若不存在偏序关系，则不能合并；

其中的偏序关系是指：若A向量中的每一维都大于等于B向量，那么A，B向量之间存在偏序关系，否则不存在偏序关系。
举个例子：
A，B，C 三个节点的初始时间向量都是 (0,0,0)，该向量的一，二，三维分别对应 A，B，C 三个节点各自的时间。

A 作出更改 Key=Value1，时间向量变为 (1,0,0)；
A 的更改传输到了 B 处，B 处 Key=Value1，且时间向量变为 (1,0,0)；
B 作出更改 Key=Value2，将时间向量中自己对应的那一维加 1 变为 (1,1,0)；
B 和 A 的更改都同步到了 C 处。C 比较两者的时间向量 (1,0,0) 和 (1,1,0)，发现存在偏序关系，于是 C 的时间向量更新为 (1,1,0) 且 Key=Value2；

向量时钟算法的实质
将逻辑上可以合并的冲突成功合并；
逻辑上无法合并的冲突依旧冲突；

真实时钟-True Time，TT

TrueTime由时钟硬件和算法组成。其中时钟硬件由GPS时钟和原子钟组成

TrueTime API

TrueTime提供了三个API来操作时间：

TT.now() 返回的是当前时间，由于时钟硬件误差的存在，这个当前时间存在一个不确定的范围(uncertainty time)，也即一个范围 [earliest, latest]，可以保证当前绝对时间一定在这个范围内，上面介绍过，这个间隔范围最大是7ms。
TT.after(t) 判断传入的时间戳是否已经是过去的时间，也即 t < TT.now().earliest。
TT.before(t) 判断传入的时间戳是否是未来的时间，也即 TT.now().latest < t。

API 搭配的两个规则
Start：提交事务Ti时，leader必须选择一个大于等于TT.now().latest的时间作为提交时间戳si。
Commit Wait： leader必须等待TT.after(si)为true后才能提交数据，也即必须等待si的绝对时间过去了才能提交数据。

使用这两个规则可以保证：如果事务 T1 提交后 T2 才开始，那么 T2 的提交时间一定晚于 T1 的提交时间。也就是说事务的提交顺序一定和事务发生的绝对时间上的顺序一致。