• 一句话描述

将数值key使用相同的函数H计算出哈希值h,根据h确定key在环上的位置,“顺时针”行走遇到的第一台服务器就是需要定位的服务器。


不带虚拟节点的一致性Hash算法

  1. 一句话描述
  2. 将数值key使用相同的函数H计算出哈希值h,根据h确定key在环上的位置,“顺时针”行走遇到的第一台服务器就是需要定位的服务器。
  3. 特性
  4. 容错性
  5. 扩展性
  6. Hash算法的选择
  7. Hash算法一般不自己写,采用现成的;
  8. 参考 http://www.alloyteam.com/2017/05/hash-functions-introduction/
  9. 数据倾斜问题
  10. 增加虚拟节点;
  11. 应用场景
  12. 分布式缓存中有实践;
  13. 优点:减少数据迁移时的大量ID变动,提升性能;
  14. 面试
  15. 一致性哈希算法在分布式场景中的应用
  16. 漫画:什么是一致性哈希
  17. 一致性Hash基于Java的实现
  18. https://www.cnblogs.com/yiwangzhibujian/p/7090471.html
  19. 对一致性Hash算法,Java代码实现的深入研究
  20. 不带虚拟节点的一致性Hash算法
  21. public class ConsistentHashingWithoutVirtualNode {
  22. /**
  23. * 待添加入Hash环的服务器列表
  24. */
  25. private static String[] servers = {"192.168.0.0:111", "192.168.0.1:111", "192.168.0.2:111",
  26. "192.168.0.3:111", "192.168.0.4:111"};
  27. /**
  28. * key表示服务器的hash值,value表示服务器的名称
  29. */
  30. private static SortedMap<Integer, String> sortedMap = new TreeMap<Integer, String>();
  31. /**
  32. * 程序初始化,将所有的服务器放入sortedMap中
  33. */
  34. static {
  35. for (int i = 0; i < servers.length; i++) {
  36. int hash = getHash(servers[i]);
  37. System.out.println("[" + servers[i] + "]加入集合中, 其Hash值为" + hash);
  38. sortedMap.put(hash, servers[i]);
  39. }
  40. System.out.println();
  41. }
  42. public static void main(String[] args) {
  43. String[] nodes = {"127.0.0.1:1111", "221.226.0.1:2222", "10.211.0.1:3333"};
  44. for (int i = 0; i < nodes.length; i++) {
  45. System.out.println("[" + nodes[i] + "]的hash值为" +
  46. getHash(nodes[i]) + ", 被路由到结点[" + getServer(nodes[i]) + "]");
  47. }
  48. }
  49. /**
  50. * 使用FNV1_32_HASH算法计算服务器的Hash值,这里不使用重写hashCode的方法,最终效果没区别
  51. */
  52. private static int getHash(String str) {
  53. final int p = 16777619;
  54. int hash = (int) 2166136261L;
  55. for (int i = 0; i < str.length(); i++) { hash = (hash ^ str.charAt(i)) * p; }
  56. hash += hash << 13;
  57. hash ^= hash >> 7;
  58. hash += hash << 3;
  59. hash ^= hash >> 17;
  60. hash += hash << 5;
  61. // 如果算出来的值为负数则取其绝对值
  62. if (hash < 0) { hash = Math.abs(hash); }
  63. return hash;
  64. }
  65. /**
  66. * 得到应当路由到的结点
  67. */
  68. private static String getServer(String node) {
  69. // 得到带路由的结点的Hash值
  70. int hash = getHash(node);
  71. // 得到大于该Hash值的所有Map
  72. SortedMap<Integer, String> subMap = sortedMap.tailMap(hash);
  73. // 第一个Key就是顺时针过去离node最近的那个结点
  74. Integer i = subMap.firstKey();
  75. // 返回对应的服务器名称
  76. return subMap.get(i);
  77. }
  78. }
  79. 带虚拟节点的一致性Hash算法
  80. public class ConsistentHashingWithVirtualNode
  81. {
  82. /**
  83. * 待添加入Hash环的服务器列表
  84. */
  85. private static String[] servers = {"192.168.0.0:111", "192.168.0.1:111", "192.168.0.2:111",
  86. "192.168.0.3:111", "192.168.0.4:111"};
  87. /**
  88. * 真实结点列表,考虑到服务器上线、下线的场景,即添加、删除的场景会比较频繁,这里使用LinkedList会更好
  89. */
  90. private static List<String> realNodes = new LinkedList<String>();
  91. /**
  92. * 虚拟节点,key表示虚拟节点的hash值,value表示虚拟节点的名称
  93. */
  94. private static SortedMap<Integer, String> virtualNodes =
  95. new TreeMap<Integer, String>();
  96. /**
  97. * 虚拟节点的数目,这里写死,为了演示需要,一个真实结点对应5个虚拟节点
  98. */
  99. private static final int VIRTUAL_NODES = 5;
  100. static
  101. {
  102. // 先把原始的服务器添加到真实结点列表中
  103. for (int i = 0; i < servers.length; i++) { realNodes.add(servers[i]); }
  104. // 再添加虚拟节点,遍历LinkedList使用foreach循环效率会比较高
  105. for (String str : realNodes)
  106. {
  107. for (int i = 0; i < VIRTUAL_NODES; i++)
  108. {
  109. String virtualNodeName = str + "&&VN" + String.valueOf(i);
  110. int hash = getHash(virtualNodeName);
  111. System.out.println("虚拟节点[" + virtualNodeName + "]被添加, hash值为" + hash);
  112. virtualNodes.put(hash, virtualNodeName);
  113. }
  114. }
  115. System.out.println();
  116. }
  117. /**
  118. * 使用FNV1_32_HASH算法计算服务器的Hash值,这里不使用重写hashCode的方法,最终效果没区别
  119. */
  120. private static int getHash(String str)
  121. {
  122. final int p = 16777619;
  123. int hash = (int)2166136261L;
  124. for (int i = 0; i < str.length(); i++) { hash = (hash ^ str.charAt(i)) * p; }
  125. hash += hash << 13;
  126. hash ^= hash >> 7;
  127. hash += hash << 3;
  128. hash ^= hash >> 17;
  129. hash += hash << 5;
  130. // 如果算出来的值为负数则取其绝对值
  131. if (hash < 0) { hash = Math.abs(hash); }
  132. return hash;
  133. }
  134. /**
  135. * 得到应当路由到的结点
  136. */
  137. private static String getServer(String node)
  138. {
  139. // 得到带路由的结点的Hash值
  140. int hash = getHash(node);
  141. // 得到大于该Hash值的所有Map
  142. SortedMap<Integer, String> subMap =
  143. virtualNodes.tailMap(hash);
  144. // 第一个Key就是顺时针过去离node最近的那个结点
  145. Integer i = subMap.firstKey();
  146. // 返回对应的虚拟节点名称,这里字符串稍微截取一下
  147. String virtualNode = subMap.get(i);
  148. return virtualNode.substring(0, virtualNode.indexOf("&&"));
  149. }
  150. public static void main(String[] args)
  151. {
  152. String[] nodes = {"127.0.0.1:1111", "221.226.0.1:2222", "10.211.0.1:3333"};
  153. for (int i = 0; i < nodes.length; i++) {
  154. System.out.println("[" + nodes[i] + "]的hash值为" +
  155. getHash(nodes[i]) + ", 被路由到结点[" + getServer(nodes[i]) + "]");
  156. }
  157. }
  158. }

面试选备:一致性Hash算法 - 图1

带虚拟节点的一致性Hash算法

  1. 一句话描述
  2. 将数值key使用相同的函数H计算出哈希值h,根据h确定key在环上的位置,“顺时针”行走遇到的第一台服务器就是需要定位的服务器。
  3. 特性
  4. 容错性
  5. 扩展性
  6. Hash算法的选择
  7. Hash算法一般不自己写,采用现成的;
  8. 参考 http://www.alloyteam.com/2017/05/hash-functions-introduction/
  9. 数据倾斜问题
  10. 增加虚拟节点;
  11. 应用场景
  12. 分布式缓存中有实践;
  13. 优点:减少数据迁移时的大量ID变动,提升性能;
  14. 面试
  15. 一致性哈希算法在分布式场景中的应用
  16. 漫画:什么是一致性哈希
  17. 一致性Hash基于Java的实现
  18. https://www.cnblogs.com/yiwangzhibujian/p/7090471.html
  19. 对一致性Hash算法,Java代码实现的深入研究
  20. 不带虚拟节点的一致性Hash算法
  21. public class ConsistentHashingWithoutVirtualNode {
  22. /**
  23. * 待添加入Hash环的服务器列表
  24. */
  25. private static String[] servers = {"192.168.0.0:111", "192.168.0.1:111", "192.168.0.2:111",
  26. "192.168.0.3:111", "192.168.0.4:111"};
  27. /**
  28. * key表示服务器的hash值,value表示服务器的名称
  29. */
  30. private static SortedMap<Integer, String> sortedMap = new TreeMap<Integer, String>();
  31. /**
  32. * 程序初始化,将所有的服务器放入sortedMap中
  33. */
  34. static {
  35. for (int i = 0; i < servers.length; i++) {
  36. int hash = getHash(servers[i]);
  37. System.out.println("[" + servers[i] + "]加入集合中, 其Hash值为" + hash);
  38. sortedMap.put(hash, servers[i]);
  39. }
  40. System.out.println();
  41. }
  42. public static void main(String[] args) {
  43. String[] nodes = {"127.0.0.1:1111", "221.226.0.1:2222", "10.211.0.1:3333"};
  44. for (int i = 0; i < nodes.length; i++) {
  45. System.out.println("[" + nodes[i] + "]的hash值为" +
  46. getHash(nodes[i]) + ", 被路由到结点[" + getServer(nodes[i]) + "]");
  47. }
  48. }
  49. /**
  50. * 使用FNV1_32_HASH算法计算服务器的Hash值,这里不使用重写hashCode的方法,最终效果没区别
  51. */
  52. private static int getHash(String str) {
  53. final int p = 16777619;
  54. int hash = (int) 2166136261L;
  55. for (int i = 0; i < str.length(); i++) { hash = (hash ^ str.charAt(i)) * p; }
  56. hash += hash << 13;
  57. hash ^= hash >> 7;
  58. hash += hash << 3;
  59. hash ^= hash >> 17;
  60. hash += hash << 5;
  61. // 如果算出来的值为负数则取其绝对值
  62. if (hash < 0) { hash = Math.abs(hash); }
  63. return hash;
  64. }
  65. /**
  66. * 得到应当路由到的结点
  67. */
  68. private static String getServer(String node) {
  69. // 得到带路由的结点的Hash值
  70. int hash = getHash(node);
  71. // 得到大于该Hash值的所有Map
  72. SortedMap<Integer, String> subMap = sortedMap.tailMap(hash);
  73. // 第一个Key就是顺时针过去离node最近的那个结点
  74. Integer i = subMap.firstKey();
  75. // 返回对应的服务器名称
  76. return subMap.get(i);
  77. }
  78. }
  79. 带虚拟节点的一致性Hash算法
  80. public class ConsistentHashingWithVirtualNode
  81. {
  82. /**
  83. * 待添加入Hash环的服务器列表
  84. */
  85. private static String[] servers = {"192.168.0.0:111", "192.168.0.1:111", "192.168.0.2:111",
  86. "192.168.0.3:111", "192.168.0.4:111"};
  87. /**
  88. * 真实结点列表,考虑到服务器上线、下线的场景,即添加、删除的场景会比较频繁,这里使用LinkedList会更好
  89. */
  90. private static List<String> realNodes = new LinkedList<String>();
  91. /**
  92. * 虚拟节点,key表示虚拟节点的hash值,value表示虚拟节点的名称
  93. */
  94. private static SortedMap<Integer, String> virtualNodes =
  95. new TreeMap<Integer, String>();
  96. /**
  97. * 虚拟节点的数目,这里写死,为了演示需要,一个真实结点对应5个虚拟节点
  98. */
  99. private static final int VIRTUAL_NODES = 5;
  100. static
  101. {
  102. // 先把原始的服务器添加到真实结点列表中
  103. for (int i = 0; i < servers.length; i++) { realNodes.add(servers[i]); }
  104. // 再添加虚拟节点,遍历LinkedList使用foreach循环效率会比较高
  105. for (String str : realNodes)
  106. {
  107. for (int i = 0; i < VIRTUAL_NODES; i++)
  108. {
  109. String virtualNodeName = str + "&&VN" + String.valueOf(i);
  110. int hash = getHash(virtualNodeName);
  111. System.out.println("虚拟节点[" + virtualNodeName + "]被添加, hash值为" + hash);
  112. virtualNodes.put(hash, virtualNodeName);
  113. }
  114. }
  115. System.out.println();
  116. }
  117. /**
  118. * 使用FNV1_32_HASH算法计算服务器的Hash值,这里不使用重写hashCode的方法,最终效果没区别
  119. */
  120. private static int getHash(String str)
  121. {
  122. final int p = 16777619;
  123. int hash = (int)2166136261L;
  124. for (int i = 0; i < str.length(); i++) { hash = (hash ^ str.charAt(i)) * p; }
  125. hash += hash << 13;
  126. hash ^= hash >> 7;
  127. hash += hash << 3;
  128. hash ^= hash >> 17;
  129. hash += hash << 5;
  130. // 如果算出来的值为负数则取其绝对值
  131. if (hash < 0) { hash = Math.abs(hash); }
  132. return hash;
  133. }
  134. /**
  135. * 得到应当路由到的结点
  136. */
  137. private static String getServer(String node)
  138. {
  139. // 得到带路由的结点的Hash值
  140. int hash = getHash(node);
  141. // 得到大于该Hash值的所有Map
  142. SortedMap<Integer, String> subMap =
  143. virtualNodes.tailMap(hash);
  144. // 第一个Key就是顺时针过去离node最近的那个结点
  145. Integer i = subMap.firstKey();
  146. // 返回对应的虚拟节点名称,这里字符串稍微截取一下
  147. String virtualNode = subMap.get(i);
  148. return virtualNode.substring(0, virtualNode.indexOf("&&"));
  149. }
  150. public static void main(String[] args)
  151. {
  152. String[] nodes = {"127.0.0.1:1111", "221.226.0.1:2222", "10.211.0.1:3333"};
  153. for (int i = 0; i < nodes.length; i++) {
  154. System.out.println("[" + nodes[i] + "]的hash值为" +
  155. getHash(nodes[i]) + ", 被路由到结点[" + getServer(nodes[i]) + "]");
  156. }
  157. }
  158. }

面试选备:一致性Hash算法 - 图2