一 使用场景

  1. 分布式协调:这个其实是zk很经典的一个用法。你A系统发送个请求到mq,然后B消息消费之后处理了。那A系统如何知道B系统的处理结果?用zk就可以实现分布式系统之间的协调工作。A系统发送请求之后可以在zk上对某个节点的值注册个监听器,一旦B系统处理完了就修改zk那个节点的值,A立马就可以收到通知,完美解决。
  2. 分布式锁:对某一个数据连续发出两个修改操作,两台机器同时收到了请求,但是只能一台机器先执行另外一个机器再执行。那么此时就可以使用zk分布式锁,一个机器接收到了请求之后先获取zk上的一把分布式锁,就是可以去创建一个znode,接着执行操作;然后另外一个机器也尝试去创建那个znode,结果发现自己创建不了,因为被别人创建了。那只能等着,等第一个机器执行完了自己再执行。
  3. 元数据/配置信息管理:zk可以用作很多系统的配置信息的管理,比如kafka、storm等等很多分布式系统都会选用zk来做一些元数据、配置信息的管理,包括dubbo注册中心不也支持zk么
  4. HA高可用性:这个应该是很常见的,比如hadoop、hdfs、yarn等很多大数据系统,都选择基于zk来开发HA高可用机制,就是一个重要进程一般会做主备两个,主进程挂了立马通过zk感知到切换到备用进程

    二 分布式锁

    分布式锁3个重要的考量点:互斥(只能有一个客户端获取锁),不能死锁,容错(这个锁就可以加可以释放)

    2.1 redis分布式锁

    2.1.1 普通分布式锁

    第一个最普通的实现方式,如果就是在redis里创建一个key算加锁:

  5. SET my:lock 随机值 NX PX 30000,这个命令就ok,这个的NX的意思就是只有key不存在的时候才会设置成功,PX 30000的意思是30秒后锁自动释放。别人创建的时候如果发现已经有了就不能加锁了。

  6. 释放锁就是删除key,但是一般可以用lua脚本删除,判断value一样才删除:

    1. if redis.call("get",KEYS[1]) == ARGV[1] then
    2. return redis.call("del",KEYS[1])
    3. else
    4. return 0
    5. end

    PS:

  7. 为啥加过期时间,为了容错防止死锁

  8. 加上过期时间引发的问题,如果threadA 执行时间为15秒,我们设置的timeout为10秒,那么有可能threadA没有执行完,就执行删除,然后threadB成功上锁。这样是有问题的。因此我们使用lua脚本+随机值释放锁,即我thread1执行的时候,过期删除的时候不能正确执行因为每个线程的随机不匹配,所以不能过期删除。
  9. 没法高可用,当master 异步同步锁失败。那么导致分布式锁机制失效。

    2.1.2 RedLock 红锁算法

    假设有一个redis cluster,有5个redis master实例,5个slave。然后执行如下步骤获取一把锁:

  10. 获取当前时间戳,单位是毫秒

  11. 跟上面类似,轮流尝试在每个master节点上创建锁,过期时间较短,一般就几十毫秒
  12. 尝试在大多数节点上建立一个锁,比如5个节点就要求是3个节点(n / 2 +1)
  13. 客户端计算建立好锁的时间,如果建立锁的时间小于超时时间,就算建立成功了
  14. 要是锁建立失败了,那么就依次删除这个锁
  15. 只要别人建立了一把分布式锁,你就得不断轮询去尝试获取锁

PS:

  1. 目前社区很多大佬质疑该算法是否可靠。

    2.2 zookeeper 分布式锁

    zk分布式锁,就是某个节点尝试创建临时顺序znode,此时创建成功了就获取了这个锁;这个时候别的客户端来创建锁会失败,只能注册个监听器监听这个锁。释放锁就是删除这个znode,一旦释放掉就会通知客户端,然后有一个等待着的客户端就可以再次重新枷锁。 ```java public class ZooKeeperDistributedLock implements Watcher{

    private ZooKeeper zk; private String locksRoot= “/locks”; private String productId; private String waitNode; private String lockNode; private CountDownLatch latch; private CountDownLatch connectedLatch = new CountDownLatch(1); private int sessionTimeout = 30000;

    public ZooKeeperDistributedLock(String productId){

     this.productId = productId;
     try {
         String address = "192.168.31.187:2181,192.168.31.19:2181,192.168.31.227:2181";
         zk = new ZooKeeper(address, sessionTimeout, this);
         connectedLatch.await();
     } catch (IOException e) {
         throw new LockException(e);
     } catch (KeeperException e) {
         throw new LockException(e);
     } catch (InterruptedException e) {
         throw new LockException(e);
     }
    

    }

    public void process(WatchedEvent event) {

     if(event.getState()==KeeperState.SyncConnected){
         connectedLatch.countDown();
         return;
     }
    
     if(this.latch != null) {  
         this.latch.countDown(); 
     }
    

    }

    public void acquireDistributedLock() {

     try {
         if(this.tryLock()){
             return;
         }
         else{
             waitForLock(waitNode, sessionTimeout);
         }
     } catch (KeeperException e) {
         throw new LockException(e);
     } catch (InterruptedException e) {
         throw new LockException(e);
     } 
    

    }

    public boolean tryLock() {

     try {
         // 传入进去的locksRoot + “/” + productId
         // 假设productId代表了一个商品id,比如说1
         // locksRoot = locks
         // /locks/10000000000,/locks/10000000001,/locks/10000000002
         lockNode = zk.create(locksRoot + "/" + productId, new byte[0], ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL);
    
         // 看看刚创建的节点是不是最小的节点
         // locks:10000000000,10000000001,10000000002
         List<String> locks = zk.getChildren(locksRoot, false);
         Collections.sort(locks);
    
         if(lockNode.equals(locksRoot+"/"+ locks.get(0))){
             //如果是最小的节点,则表示取得锁
             return true;
         }
    
         //如果不是最小的节点,找到比自己小1的节点
         int previousLockIndex = -1;
         for(int i = 0; i < locks.size(); i++) {
             if(lockNode.equals(locksRoot + “/” + locks.get(i))) {
                 previousLockIndex = i - 1;
                 break;
             }
         }
    
         this.waitNode = locks.get(previousLockIndex);
     } catch (KeeperException e) {
         throw new LockException(e);
     } catch (InterruptedException e) {
         throw new LockException(e);
     }
     return false;
    

    }

    private boolean waitForLock(String waitNode, long waitTime) throws InterruptedException, KeeperException {

     Stat stat = zk.exists(locksRoot + "/" + waitNode, true);
     if(stat != null){
         this.latch = new CountDownLatch(1);
         this.latch.await(waitTime, TimeUnit.MILLISECONDS);   
         this.latch = null;
     }
     return true;
    

    }

    public void unlock() {

     try {
         // 删除/locks/10000000000节点
         // 删除/locks/10000000001节点
         System.out.println("unlock " + lockNode);
         zk.delete(lockNode,-1);
         lockNode = null;
         zk.close();
     } catch (InterruptedException e) {
         e.printStackTrace();
     } catch (KeeperException e) {
         e.printStackTrace();
     }
    

    }

    public class LockException extends RuntimeException {

     private static final long serialVersionUID = 1L;
     public LockException(String e){
         super(e);
     }
     public LockException(Exception e){
         super(e);
     }
    

    } }

``` 如果有一把锁,被多个人给竞争,此时多个人会排队,第一个拿到锁的人会执行,然后释放锁,后面的每个人都会去监听排在自己前面的那个人创建的node上,一旦某个人释放了锁,排在自己后面的人就会被zookeeper给通知,一旦被通知了之后,就ok了,自己就获取到了锁,就可以执行代码了。