分布式中ID的常用解决方案
- 全局唯一性:不能出现重复的ID号
- 递增:趋势递增,即保证下一个ID一定大于上一个ID,而比较苛刻的要求是连续递增,如1,2,3等等。
- 高可用高性能:服务不能挂,性能要好
- 信息安全:如果ID是连续的,恶意用户的扒取工作就非常容易做了,需要ID无规则、不规则。
唯一ID可以标识数据的唯一性,在分布式系统中生成唯一ID的方案有很多,常见的方式大概有以下三种:
- 依赖数据库,使用如MySQL自增列或Oracle序列等。
- UUID随机数
- snowflake雪花算法(本文将要讨论)
采用数据库自增序列:
- 读写分离时,只有主节点可以进行写操作,可能有单点故障的风险
- 分表分库,数据迁移合并等比较麻烦
UUID随机数:
- 采用无意义字符串,没有排序
- UUID使用字符串形式存储,数据量大时查询效率比较低
雪花:
- 41位为时间戳,12位为在这一刻能够产生2^12个自增的Id
- 这结合了自增Id的优势,同时10位机器ID(dataCenterId 5位和machineId 5位)确保了分布式能够支持1024台节点
实现
package mainimport ("errors""fmt""sync""time")// 因为snowFlake目的是解决分布式下生成唯一id 所以ID中是包含集群和节点编号在内的const (workerBits uint8 = 10 // 每台机器(节点)的ID位数 10位最大可以有2^10=1024个节点,编号为:0-1023numberBits uint8 = 12 // 表示每个集群下的每个节点,1毫秒内可生成的id序号的二进制位数 即每毫秒可生成 2^12-1=4095个唯一ID// 这里求最大值使用了位运算,-1 的二进制表示为 1 的补码,感兴趣的同学可以自己算算试试 -1 ^ (-1 << nodeBits) 这里是不是等于 1023workerMax int64 = -1 ^ (-1 << workerBits) // 节点ID的最大值,用于防止溢出numberMax int64 = -1 ^ (-1 << numberBits) // 同上,用来表示生成id序号的最大值timeShift uint8 = workerBits + numberBits // 时间戳向左的偏移量workerShift uint8 = numberBits // 节点ID向左的偏移量// 41位字节作为时间戳数值的话 大约68年就会用完// 假如你2010年1月1日开始开发系统 如果不减去2010年1月1日的时间戳 那么白白浪费40年的时间戳啊!// 这个一旦定义且开始生成ID后千万不要改了 不然可能会生成相同的IDepoch int64 = 1597113860060 // 这个是我在写epoch这个变量时的时间戳(毫秒))// 定义一个woker工作节点所需要的基本参数type Worker struct {mu sync.Mutex // 添加互斥锁 确保并发安全timestamp int64 // 记录时间戳workerId int64 // 该节点的IDnumber int64 // 当前毫秒已经生成的id序列号(从0开始累加) 1毫秒内最多生成4095个ID}// 实例化一个工作节点func NewWorker(workerId int64) (*Worker, error) {// 要先检测workerId是否在上面定义的范围内if workerId < 0 || workerId > workerMax {return nil, errors.New("Worker ID excess of quantity")}// 生成一个新节点return &Worker{timestamp: 0,workerId: workerId,number: 0,}, nil}// 接下来我们开始生成id// 生成方法一定要挂载在某个woker下,这样逻辑会比较清晰 指定某个节点生成idfunc (w *Worker) GetId() int64 {// 获取id最关键的一点 加锁 加锁 加锁w.mu.Lock()defer w.mu.Unlock() // 生成完成后记得 解锁 解锁 解锁// 获取生成时的时间戳now := time.Now().UnixNano() / 1e6 // 纳秒转毫秒if w.timestamp == now {w.number++// 这里要判断,当前工作节点是否在1毫秒内已经生成numberMax个IDif w.number > numberMax {// 如果当前工作节点在1毫秒内生成的ID已经超过上限 需要等待1毫秒再继续生成for now <= w.timestamp {now = time.Now().UnixNano() / 1e6}}} else {// 如果当前时间与工作节点上一次生成ID的时间不一致 则需要重置工作节点生成ID的序号w.number = 0w.timestamp = now // 将机器上一次生成ID的时间更新为当前时间}// 第一段 now - epoch 为该算法目前已经奔跑了xxx毫秒// 如果在程序跑了一段时间修改了epoch这个值 可能会导致生成相同的IDID := int64((now-epoch)<<timeShift | (w.workerId << workerShift) | (w.number))return ID}func main() {worker, err := NewWorker(3)if err != nil {fmt.Println(err.Error())return}t := time.NewTicker(time.Second / 4)for {fmt.Println(worker.GetId())<-t.C}}
snowflake
地址:https://github.com/bwmarrin/snowflake
文档:https://godoc.org/github.com/bwmarrin/snowflake
type Node
type Node struct {// contains filtered or unexported fields}
func NewNode(node int64) (Node, error) 设置工作节点
func (n Node) Generate() ID
type ID
type ID int64
func ParseBase32(b []byte) (ID, error) 将base32的字节码转为ID
func ParseBase64(id string) (ID, error) 将base64的字节码转为ID
func ParseBytes(id []byte) (ID, error) 将字节码转为ID
func ParseInt64(id int64) ID 将INT64转为ID
func (f ID) Base32() string 将ID转为base32的字符串
func (f ID) Base64() string 将ID转为base64的字符串
func (f ID) Bytes() []byte 将ID转为字节码
func (f ID) Int64() int64 将ID转为INT64
Sonyflake
Sonyflake是一个受Twitter Snowflake启发的分布式唯一ID生成器。 索尼flake ID由以下组成
39 bits for time in units of 10 msec8 bits for a sequence number16 bits for a machine id
Constants
const (BitLenTime = 39 // bit length of timeBitLenSequence = 8 // bit length of sequence numberBitLenMachineID = 63 - BitLenTime - BitLenSequence // bit length of machine id)
func Decompose(id uint64) map[string]uint64 Decompose returns a set of Sonyflake ID parts
type Settings
type Settings struct {StartTime time.TimeMachineID func() (uint16, error)CheckMachineID func(uint16) bool}StartTime是定义Sonyflake时间为经过时间之后的时间。当“StartTime”为“0”时,表示设置索尼flake的开始时间为“2014-09-01 00:00:00 +0000 UTC”。如果“StartTime”在当前时间之前,则不创建Sonyflake。MachineID返回Sonyflake实例的唯一ID。如果MachineID返回错误,则Sonyflake不会创建。如果MachineID为空,则使用默认值MachineID。Default MachineID返回私网IP地址的下16位。CheckMachineID用于验证机器ID的唯一性。如果CheckMachineID返回false,说明Sonyflake不创建
type Sonyflake
type Sonyflake struct {// contains filtered or unexported fields}
func NewSonyflake(st Settings) Sonyflake
func (sf Sonyflake) NextID() (uint64, error)
