两阶段提交就是使用XA协议的原理,两阶段提交这种解决方案牺牲了一部分可用性来换取一致性

优点:尽量保证了数据的强一致性,适合对数据强一致要求很高的关键领域
缺点:实现复杂,牺牲了可用性,对性能影响较大,不适合高并发性能场景。同步阻塞、单点故障、数据不一致
两阶段提交算法成立基于以下假设:

  1. 该分布式系统中,存在一个节点作为协调者,其他节点作为参与者,且节点之间可以进行网络通信
  2. 所有节点都采用预写式日志,且日志被写入后即被保存在可靠的存储设备上,即使节点损坏也不会导致日志数据的丢失
  3. 所有节点不会永久性损坏,即使损坏后仍然可以恢复

阶段一:提交事务请求(投票)

1)TM向所有的AP发送事务内容,询问是否可以执行事务的提交操作,并等待各个AP的响应
2)执行事务
各个AP节点执行事务操作,将undo和redo信息记录到事务日志中,尽量把提交过程中所消耗时间的操作和准备都提前完成,确保后续事务提交的成功率
3)各个AP向TM反馈事务询问的响应
各个AP成功执行了事务操作,那么反馈给TM yes的response;如果AP没有成功执行事务,就反馈TM no的response

阶段二:执行事务提交

1)执行提交事务
两阶段提交协议 - 图1

假设一个事务的提交过程总共需要30s, 其中prepare操作需要28(事务日志落地磁盘及各种io操作),而真正commit只需要2s,那么,commit阶段发生错误的概率和prepare相比, 2/28 (<10%) .只要第一个阶段成功,那么commit阶段出现失败的概率就非常小,大大增加了分布式事务的成功概率

2)中断事务提交
两阶段提交协议 - 图2

3)2pc存在的问题
1、数据一致性。数据不一致。在二阶段提交的阶段二中,当协调者向参与者发送commit请求之后,发生了局部网络异常或者在发送commit请求过程中协调者发生了故障,这回导致只有一部分参与者接受到了commit请求。而在这部分参与者接到commit请求之后就会执行commit操作。但是其他部分未接到commit请求的机器则无法执行事务提交。于是整个分布式系统便出现了数据部一致性的现象。
2、同步阻塞。执行过程中,所有参与节点都是事务阻塞型的。当参与者占有公共资源时,其他第三方节点访问公共资源不得不处于阻塞状态。
3、单点故障。由于协调者的重要性,一旦协调者发生故障。参与者会一直阻塞下去。尤其在第二阶段,协调者发生故障,那么所有的参与者还都处于锁定事务资源的状态中,而无法继续完成事务操作。(如果是协调者挂掉,可以重新选举一个协调者,但是无法解决因为协调者宕机导致的参与者处于阻塞状态的问题)
4、二阶段无法解决的问题:协调者再发出commit消息之后宕机,而唯一接收到这条消息的参与者同时也宕机了。那么即使协调者通过选举协议产生了新的协调者,这条事务的状态也是不确定的,没人知道事务是否被已经提交。

由于二阶段提交存在着诸如同步阻塞、单点问题、脑裂等缺陷,所以,研究者们在二阶段提交的基础上做了改进,提出了三阶段提交。

通过2pc的方式去完成分布式事务,虽然通过这种方式能够达到预期的效果,但是我们在现实中很少会用到2pc方式的提交的XA事务,有几个原因
1.互联网电商应用的快速发展,对事务和数据的绝对一致性要求并没有传统企业应用那么高
2.XA事务的介入增加了TM中间件,使得系统复杂化
3.XA事务的性能不高,因为TM要等待RM回应,所以为了确保事务尽量成功提交,等待超时的时间通常比较长,比如30s到几分钟,如果RM出现故障或者响应比较慢,则整个事务的性能严重下降