分布式中ID的常用解决方案

  • 全局唯一性:不能出现重复的ID号
  • 递增:趋势递增,即保证下一个ID一定大于上一个ID,而比较苛刻的要求是连续递增,如1,2,3等等。
  • 高可用高性能:服务不能挂,性能要好
  • 信息安全:如果ID是连续的,恶意用户的扒取工作就非常容易做了,需要ID无规则、不规则。

唯一ID可以标识数据的唯一性,在分布式系统中生成唯一ID的方案有很多,常见的方式大概有以下三种:

  • 依赖数据库,使用如MySQL自增列或Oracle序列等。
  • UUID随机数
  • snowflake雪花算法(本文将要讨论)

采用数据库自增序列:

  • 读写分离时,只有主节点可以进行写操作,可能有单点故障的风险
  • 分表分库,数据迁移合并等比较麻烦

UUID随机数:

  • 采用无意义字符串,没有排序
  • UUID使用字符串形式存储,数据量大时查询效率比较低

雪花:
snowflake - 图1

  • 41位为时间戳,12位为在这一刻能够产生2^12个自增的Id
  • 这结合了自增Id的优势,同时10位机器ID(dataCenterId 5位和machineId 5位)确保了分布式能够支持1024台节点

实现

  1. package main
  2. import (
  3. "errors"
  4. "fmt"
  5. "sync"
  6. "time"
  7. )
  8. // 因为snowFlake目的是解决分布式下生成唯一id 所以ID中是包含集群和节点编号在内的
  9. const (
  10. workerBits uint8 = 10 // 每台机器(节点)的ID位数 10位最大可以有2^10=1024个节点,编号为:0-1023
  11. numberBits uint8 = 12 // 表示每个集群下的每个节点,1毫秒内可生成的id序号的二进制位数 即每毫秒可生成 2^12-1=4095个唯一ID
  12. // 这里求最大值使用了位运算,-1 的二进制表示为 1 的补码,感兴趣的同学可以自己算算试试 -1 ^ (-1 << nodeBits) 这里是不是等于 1023
  13. workerMax int64 = -1 ^ (-1 << workerBits) // 节点ID的最大值,用于防止溢出
  14. numberMax int64 = -1 ^ (-1 << numberBits) // 同上,用来表示生成id序号的最大值
  15. timeShift uint8 = workerBits + numberBits // 时间戳向左的偏移量
  16. workerShift uint8 = numberBits // 节点ID向左的偏移量
  17. // 41位字节作为时间戳数值的话 大约68年就会用完
  18. // 假如你2010年1月1日开始开发系统 如果不减去2010年1月1日的时间戳 那么白白浪费40年的时间戳啊!
  19. // 这个一旦定义且开始生成ID后千万不要改了 不然可能会生成相同的ID
  20. epoch int64 = 1597113860060 // 这个是我在写epoch这个变量时的时间戳(毫秒)
  21. )
  22. // 定义一个woker工作节点所需要的基本参数
  23. type Worker struct {
  24. mu sync.Mutex // 添加互斥锁 确保并发安全
  25. timestamp int64 // 记录时间戳
  26. workerId int64 // 该节点的ID
  27. number int64 // 当前毫秒已经生成的id序列号(从0开始累加) 1毫秒内最多生成4095个ID
  28. }
  29. // 实例化一个工作节点
  30. func NewWorker(workerId int64) (*Worker, error) {
  31. // 要先检测workerId是否在上面定义的范围内
  32. if workerId < 0 || workerId > workerMax {
  33. return nil, errors.New("Worker ID excess of quantity")
  34. }
  35. // 生成一个新节点
  36. return &Worker{
  37. timestamp: 0,
  38. workerId: workerId,
  39. number: 0,
  40. }, nil
  41. }
  42. // 接下来我们开始生成id
  43. // 生成方法一定要挂载在某个woker下,这样逻辑会比较清晰 指定某个节点生成id
  44. func (w *Worker) GetId() int64 {
  45. // 获取id最关键的一点 加锁 加锁 加锁
  46. w.mu.Lock()
  47. defer w.mu.Unlock() // 生成完成后记得 解锁 解锁 解锁
  48. // 获取生成时的时间戳
  49. now := time.Now().UnixNano() / 1e6 // 纳秒转毫秒
  50. if w.timestamp == now {
  51. w.number++
  52. // 这里要判断,当前工作节点是否在1毫秒内已经生成numberMax个ID
  53. if w.number > numberMax {
  54. // 如果当前工作节点在1毫秒内生成的ID已经超过上限 需要等待1毫秒再继续生成
  55. for now <= w.timestamp {
  56. now = time.Now().UnixNano() / 1e6
  57. }
  58. }
  59. } else {
  60. // 如果当前时间与工作节点上一次生成ID的时间不一致 则需要重置工作节点生成ID的序号
  61. w.number = 0
  62. w.timestamp = now // 将机器上一次生成ID的时间更新为当前时间
  63. }
  64. // 第一段 now - epoch 为该算法目前已经奔跑了xxx毫秒
  65. // 如果在程序跑了一段时间修改了epoch这个值 可能会导致生成相同的ID
  66. ID := int64((now-epoch)<<timeShift | (w.workerId << workerShift) | (w.number))
  67. return ID
  68. }
  69. func main() {
  70. worker, err := NewWorker(3)
  71. if err != nil {
  72. fmt.Println(err.Error())
  73. return
  74. }
  75. t := time.NewTicker(time.Second / 4)
  76. for {
  77. fmt.Println(worker.GetId())
  78. <-t.C
  79. }
  80. }

snowflake

地址:https://github.com/bwmarrin/snowflake
文档:https://godoc.org/github.com/bwmarrin/snowflake

type Node

  1. type Node struct {
  2. // contains filtered or unexported fields
  3. }

func NewNode(node int64) (Node, error) 设置工作节点
func (n
Node) Generate() ID

type ID

  1. type ID int64

func ParseBase32(b []byte) (ID, error) 将base32的字节码转为ID
func ParseBase64(id string) (ID, error) 将base64的字节码转为ID
func ParseBytes(id []byte) (ID, error) 将字节码转为ID
func ParseInt64(id int64) ID 将INT64转为ID
func (f ID) Base32() string 将ID转为base32的字符串
func (f ID) Base64() string 将ID转为base64的字符串
func (f ID) Bytes() []byte 将ID转为字节码
func (f ID) Int64() int64 将ID转为INT64

Sonyflake

Sonyflake是一个受Twitter Snowflake启发的分布式唯一ID生成器。 索尼flake ID由以下组成

  1. 39 bits for time in units of 10 msec
  2. 8 bits for a sequence number
  3. 16 bits for a machine id

Constants

  1. const (
  2. BitLenTime = 39 // bit length of time
  3. BitLenSequence = 8 // bit length of sequence number
  4. BitLenMachineID = 63 - BitLenTime - BitLenSequence // bit length of machine id
  5. )

func Decompose(id uint64) map[string]uint64 Decompose returns a set of Sonyflake ID parts

type Settings

  1. type Settings struct {
  2. StartTime time.Time
  3. MachineID func() (uint16, error)
  4. CheckMachineID func(uint16) bool
  5. }
  6. StartTime是定义Sonyflake时间为经过时间之后的时间。当“StartTime”为“0”时,表示设置索尼flake
  7. 开始时间为“2014-09-01 00:00:00 +0000 UTC”。如果“StartTime”在当前时间之前,则不创建Sonyflake
  8. MachineID返回Sonyflake实例的唯一ID。如果MachineID返回错误,则Sonyflake不会创建。
  9. 如果MachineID为空,则使用默认值MachineIDDefault MachineID返回私网IP地址的下16位。
  10. CheckMachineID用于验证机器ID的唯一性。如果CheckMachineID返回false,说明Sonyflake不创建

type Sonyflake

  1. type Sonyflake struct {
  2. // contains filtered or unexported fields
  3. }

func NewSonyflake(st Settings) Sonyflake
func (sf
Sonyflake) NextID() (uint64, error)