前言

分布式的情况下不是和使用主键自增,可能会出现自增的主键相同的情况,下面有几种解决办法

一、UUID

Java自带的生成一串唯一随机36位字符串(32个字符串+4个“-”)的算法。它可以保证唯一性,且据说够用N亿年,但是其业务可读性差,无法有序递增。

  • UUID是通用唯一识别码(Universally Unique Identifier)的缩写,开放软件基金会(OSF)规范定义了包括网卡MAC地址、时间戳、名字空间(Namespace)、随机或伪随机数、时序等元素。利用这些元素来生成UUID。
  • UUID是由128位二进制组成,一般转换成十六进制,然后用String表示。
  • 在java中有个UUID类,有四种不同的UUID的生成策略。

    1.1 UUID 四种不同的UUID的生成策略

  1. randomly: 基于随机数生成UUID,由于Java中的随机数是伪随机数,其重复的概率是可以被计算出来的。
  2. time-based:基于时间的UUID,这个一般是通过当前时间,随机数,和本地Mac地址来计算出来,自带的JDK包并没有这个算法的我们在一些UUIDUtil中,比如我们的log4j.core.util,会重新定义UUID的高位和低位。
  3. DCE security:DCE安全的UUID。
  4. name-based:基于名字的UUID,通过计算名字和名字空间的MD5来计算UUID。

    1.2 UUID的优缺点

    优点

  5. 通过本地生成,没有经过网络I/O,性能较快。

  6. 无序,无法预测他的生成顺序。(当然这个也是他的缺点之一)

    缺点

  7. 128位二进制一般转换成36位的16进制,太长了只能用String存储,空间占用较多。

  8. 不能生成递增有序的数字。

使用场景
UUID的适用场景可以为不需要担心过多的空间占用,以及不需要生成有递增趋势的数字。在Log4j里面他在UuidPatternConverter中加入了UUID来标识每一条日志。

1.3 代码实现

  1. import java.util.UUID;
  2. public class Uuid {
  3. public static void main(String[] args) {
  4. for (int i = 0; i < 5; i++) {
  5. //注意replaceAll前面的是正则表达式
  6. String uuid = UUID.randomUUID().toString().replaceAll("-","");
  7. System.out.println(uuid);
  8. // System.out.println(uuid.length());
  9. }
  10. }
  11. }

二、SnowFlake

雪花ID,它是Twitter开源的由64位整数组成分布式ID,性能较高,并且在单机上递增。

2.1 构造雪花ID


分布式主键生成(浅谈UUID和雪花算法) - 图1
SnowFlake算法产生的ID是一个64位的整型,结构如下(每一部分用“-”符号分隔): 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
1.第一位 占用1bit,其值始终是0,没有实际作用。
2.时间戳 占用41bit,精确到毫秒,总共可以容纳约69年的时间。
3.工作机器id 占用10bit,其中高位5bit是数据中心ID,低位5bit是工作节点ID,做多可以容纳1024个节点。
4.序列号 占用12bit,每个节点每毫秒0开始不断累加,最多可以累加到4095,一共可以产生4096个ID。

2.2 使用雪花算法注意事项

SnowFlake算法生成的ID大致上是按照时间递增的,用在分布式系统中时,需要注意数据中心标识和机器标识必须唯一,这样就能保证每个节点生成的ID都是唯一的。

2.3 代码实现

JAVA 实现

  1. import java.util.Random;
  2. /**
  3. * SequenceGenerateUtil class
  4. * from snowflake
  5. */
  6. public class SequenceGenerateUtil {
  7. /**
  8. * Twitter_Snowflake<br>
  9. * SnowFlake的结构如下(每部分用-分开):<br>
  10. * 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000 <br>
  11. * 1位标识,由于long基本类型在Java中是带符号的,最高位是符号位,正数是0,负数是1,所以id一般是正数,最高位是0<br>
  12. * 41位时间截(毫秒级),注意,41位时间截不是存储当前时间的时间截,而是存储时间截的差值(当前时间截 - 开始时间截)
  13. * 得到的值),这里的的开始时间截,一般是我们的id生成器开始使用的时间,由我们程序来指定的
  14. * (如下下面程序IdWorker类的startTime属性)。41位的时间截,可以使用69年,年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69<br>
  15. * 10位的数据机器位,可以部署在1024个节点,包括5位datacenterId和5位workerId<br>
  16. * 12位序列,毫秒内的计数,12位的计数顺序号支持每个节点每毫秒(同一机器,同一时间截)产生4096个ID序号<br>
  17. * 加起来刚好64位,为一个Long型。<br>
  18. * SnowFlake的优点是,整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分),
  19. * 并且效率较高,经测试,SnowFlake每秒能够产生26万ID左右。
  20. */
  21. // ==============================Fields===========================================
  22. /**
  23. * 开始时间截 (2020-10-27 15:27:28)
  24. */
  25. private final long startTimeStamp = 1603783648;
  26. /**
  27. * 机器id所占的位数
  28. */
  29. private final long machineIdBits = 5L;
  30. /**
  31. * 数据标识id所占的位数
  32. */
  33. private final long dataIdBits = 5L;
  34. /**
  35. * 支持的最大机器id,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数)
  36. */
  37. private final long maxMachineId = -1L ^ (-1L << machineIdBits);
  38. /**
  39. * 支持的最大数据标识id,结果是31
  40. */
  41. private final long maxDataId = -1L ^ (-1L << dataIdBits);
  42. /**
  43. * 序列在id中占的位数
  44. */
  45. private final long sequenceBits = 12L;
  46. /**
  47. * 机器ID向左移12位
  48. */
  49. private final long machineIdShift = sequenceBits;
  50. /**
  51. * 数据标识id向左移17位(12+5)
  52. */
  53. private final long dataIdShift = sequenceBits + machineIdBits;
  54. /**
  55. * 时间截向左移22位(5+5+12)
  56. */
  57. private final long timestampLeftShift = sequenceBits + machineIdBits + dataIdBits;
  58. /**
  59. * 生成序列的掩码,这里为4095 (0b111111111111=0xfff=4095)
  60. */
  61. private final long sequenceMask = -1L ^ (-1L << sequenceBits);
  62. /**
  63. * 工作机器ID(0~31)
  64. */
  65. private long machineId;
  66. /**
  67. * 数据中心ID(0~31)
  68. */
  69. private long dataId;
  70. /**
  71. * 毫秒内序列(0~4095)
  72. */
  73. private long sequence = 0L;
  74. /**
  75. * 上次生成ID的时间截
  76. */
  77. private long lastTimestamp = -1L;
  78. private static Long datacenterId = Long.valueOf(new Random().nextInt(5));
  79. //==============================Constructors=====================================
  80. /**
  81. * 构造函数
  82. *
  83. * @param machineId 工作ID (0~31)
  84. * @param dataId 数据中心ID (0~31)
  85. */
  86. public SequenceGenerateUtil(long machineId, long dataId) {
  87. if (machineId > maxMachineId || machineId < 0) {
  88. throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", machineId));
  89. }
  90. if (dataId > maxDataId || dataId < 0) {
  91. throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", dataId));
  92. }
  93. this.machineId = machineId;
  94. this.dataId = dataId;
  95. }
  96. // ==============================Methods==========================================
  97. /**
  98. * 获得下一个ID (该方法是线程安全的)
  99. * 添加锁,是线程安全的。
  100. * @return SnowflakeId
  101. */
  102. public synchronized long nextId() {
  103. long timestamp = timeGen();
  104. //如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
  105. if (timestamp < lastTimestamp) {
  106. throw new RuntimeException(
  107. String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
  108. }
  109. //如果是同一时间生成的,则进行毫秒内序列
  110. if (lastTimestamp == timestamp) {
  111. sequence = (sequence + 1) & sequenceMask;
  112. //毫秒内序列溢出
  113. if (sequence == 0) {
  114. //阻塞到下一个毫秒,获得新的时间戳
  115. timestamp = tilNextMillis(lastTimestamp);
  116. }
  117. }
  118. //时间戳改变,毫秒内序列重置
  119. else {
  120. sequence = 0L;
  121. }
  122. //上次生成ID的时间截
  123. lastTimestamp = timestamp;
  124. //移位并通过或运算拼到一起组成64位的ID
  125. return ((timestamp - startTimeStamp) << timestampLeftShift) //
  126. | (dataId << dataIdShift) //
  127. | (machineId << machineIdShift) //
  128. | sequence;
  129. }
  130. /**
  131. * 阻塞到下一个毫秒,直到获得新的时间戳
  132. *
  133. * @param lastTimestamp 上次生成ID的时间截
  134. * @return 当前时间戳
  135. */
  136. protected long tilNextMillis(long lastTimestamp) {
  137. long timestamp = timeGen();
  138. while (timestamp <= lastTimestamp) {
  139. timestamp = timeGen();
  140. }
  141. return timestamp;
  142. }
  143. /**
  144. * 返回以毫秒为单位的当前时间
  145. *
  146. * @return 当前时间(毫秒)
  147. */
  148. protected long timeGen() {
  149. return System.currentTimeMillis();
  150. }
  151. /**
  152. * 获取序列号
  153. *
  154. * @param workerId
  155. * @param datacenterId
  156. * @return
  157. */
  158. public static Long getSequence(Long workerId, Long datacenterId) {
  159. return new SequenceGenerateUtil(workerId, datacenterId).nextId();
  160. }
  161. }
  1. # coding: utf-8
  2. import time
  3. class InvalidSystemClock(Exception):
  4. """
  5. 时钟回拨异常
  6. """
  7. pass
  8. # 64位ID的划分
  9. WORKER_ID_BITS = 5
  10. DATACENTER_ID_BITS = 5
  11. SEQUENCE_BITS = 12
  12. # 最大取值计算
  13. MAX_WORKER_ID = -1 ^ (-1 << WORKER_ID_BITS) # 2**5-1 0b11111
  14. MAX_DATACENTER_ID = -1 ^ (-1 << DATACENTER_ID_BITS)
  15. # 移位偏移计算
  16. WOKER_ID_SHIFT = SEQUENCE_BITS
  17. DATACENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS
  18. TIMESTAMP_LEFT_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATACENTER_ID_BITS
  19. # 序号循环掩码
  20. SEQUENCE_MASK = -1 ^ (-1 << SEQUENCE_BITS)
  21. # 开始时间截 (2015-01-01)
  22. TWEPOCH = 1420041600000
  23. class IdWorker(object):
  24. """
  25. 用于生成IDs
  26. """
  27. def __init__(self, datacenter_id, worker_id, sequence=0):
  28. """
  29. 初始化
  30. :param datacenter_id: 数据中心(机器区域)ID
  31. :param worker_id: 机器ID
  32. :param sequence: 其实序号
  33. """
  34. # sanity check
  35. if worker_id > MAX_WORKER_ID or worker_id < 0:
  36. raise ValueError('worker_id值越界')
  37. if datacenter_id > MAX_DATACENTER_ID or datacenter_id < 0:
  38. raise ValueError('datacenter_id值越界')
  39. self.worker_id = worker_id
  40. self.datacenter_id = datacenter_id
  41. self.sequence = sequence
  42. self.last_timestamp = -1 # 上次计算的时间戳
  43. def _gen_timestamp(self):
  44. """
  45. 生成整数时间戳
  46. :return:int timestamp
  47. """
  48. return int(time.time() * 1000)
  49. def get_id(self):
  50. """
  51. 获取新ID
  52. :return:
  53. """
  54. timestamp = self._gen_timestamp()
  55. # 时钟回拨
  56. if timestamp < self.last_timestamp:
  57. raise InvalidSystemClock
  58. if timestamp == self.last_timestamp:
  59. self.sequence = (self.sequence + 1) & SEQUENCE_MASK
  60. if self.sequence == 0:
  61. timestamp = self._til_next_millis(self.last_timestamp)
  62. else:
  63. self.sequence = 0
  64. self.last_timestamp = timestamp
  65. new_id = ((timestamp - TWEPOCH) << TIMESTAMP_LEFT_SHIFT) | (self.datacenter_id << DATACENTER_ID_SHIFT) | \
  66. (self.worker_id << WOKER_ID_SHIFT) | self.sequence
  67. return new_id
  68. def _til_next_millis(self, last_timestamp):
  69. """
  70. 等到下一毫秒
  71. """
  72. timestamp = self._gen_timestamp()
  73. while timestamp <= last_timestamp:
  74. timestamp = self._gen_timestamp()
  75. return timestamp
  76. if __name__ == '__main__':
  77. worker = IdWorker(0, 0)
  78. print(worker.get_id())