前言
声明,本文用得是jdk1.8
前面已经讲了Collection的总览和剖析List集合以及散列表、Map集合、红黑树的基础了:
本篇主要讲解HashMap,以及涉及到一些与hashtable的比较~
看这篇文章之前最好是有点数据结构的基础:
当然了,如果讲得有错的地方还请大家多多包涵并不吝在评论去指正~
**
一、HashMap剖析
首先看看HashMap的顶部注释说了些什么:
再来看看HashMap的类继承图:
下面我们来看一下HashMap的属性:
1.初始容量=16
2.最大容量=2的31次方
3.当添加一个元素被添加到至少THEEIFY_THRESHOLD(8)个节点的桶中,桶中链表将转化为树形结构
4.当链表小于UNTREEIFY_THRESHOLD(6) 是将树形结构转成链表
5.MIN_THREEIFY_CAPACITY(64)桶可能被转化为树形结构的最小容量
成员属性有这么几个:
再来看一下hashMap的一个内部类Node:
我们知道Hash的底层是散列表,而在Java中散列表的实现是通过数组+链表的~
再来简单看看put方法就可以印证我们的说法了:数组+链表—>散列表
我们可以简单总结出HashMap:
- 无序,允许为null,非同步
- 底层由散列表(哈希表)实现
- 初始容量和装载因子对HashMap影响挺大的,设置小了不好,设置大了也不好
1.1HashMap构造方法
HashMap的构造方法有4个:
构造函数:
1.判断初始大小是否合理
2.如果超过,赋值最大值
3.初始化装载因子
在上面的构造方法最后一行,我们会发现调用了tableSizeFor()
,我们进去看看:
这是位运算算法,具体流程可参考:
- https://www.cnblogs.com/loading4/p/6239441.html
- https://blog.csdn.net/fan2012huan/article/details/51097331
看完上面可能会感到奇怪的是:为啥是将2的整数幂的数赋给threshold?
- threshold这个成员变量是阈值,决定了是否要将散列表再散列。它的值应该是:
capacity * load factor
才对的。
其实这里仅仅是一个初始化,当创建哈希表的时候,它会重新赋值的:
1.2put方法
put方法可以说是HashMap的核心,我们来看看:
我们来看看它是怎么计算哈希值的:
为什么要这样干呢??我们一般来说直接将key作为哈希值不就好了吗,做异或运算是干嘛用的??
我们看下来:
我们是根据key的哈希值来保存在散列表中的,我们表默认的初始容量是16,要放到散列表中,就是0-15的位置上。也就是tab[i = (n - 1) & hash]
。可以发现的是:在做&
运算的时候,仅仅是后4位有效~那如果我们key的哈希值高位变化很大,低位变化很小。直接拿过去做&
运算,这就会导致计算出来的Hash值相同的很多。
而设计者将key的哈希值的高位也做了运算(与高16位做异或运算,使得在做&运算时,此时的低位实际上是高位与低位的结合),这就增加了随机性,减少了碰撞冲突的可能性!
下面我们再来看看流程是怎么样的:
put的过程
1.判断散列表是否为null,如果为null,重新初始化散列表
2.如果不为null并且没有发生碰撞,直接添加元素到散列表中
3.如果发生碰撞了,并且要插入的元素的桶的hash和key都相等,记录下来,将新值覆盖旧值
4.如果桶hash与key不想等,并且该节点是红黑树结构,调用树的插入方法
5.如果是链表结构,找到了key映射节点,就记录这个节点,退出循环。如果没有找到,在链表尾部插入节点。
插入后如果发现临界值大于TREEIFY_THRESHOLD,转成红黑树
新值覆盖旧值,返回旧值测试:
接下来我们看看resize()
方法,在初始化的时候要调用这个方法,
当散列表元素大于capacity * load factor
的时候也是调用resize()
resize()方法
触发条件:当散列表元素大于capacity * load factor
1.3get方法
1.4remove方法
二、HashMap与Hashtable对比
从存储结构和实现来讲基本上都是相同的。它和HashMap的最大的不同是它是线程安全的,另外它不允许key和value为null。Hashtable是个过时的集合类,不建议在新代码中使用,不需要线程安全的场合可以用HashMap替换,需要线程安全的场合可以用ConcurrentHashMap替换
Hashtable具体阅读源码可参考:
- https://blog.csdn.net/panweiwei1994/article/details/77427010
https://blog.csdn.net/panweiwei1994/article/details/77428710
四、总结
在JDK8中HashMap的底层是:数组+链表(散列表)+红黑树
在散列表中有装载因子这么一个属性,当装载因子初始容量小于散列表元素时,该散列表会再散列,扩容2倍!
装载因子的*默认值是0.75,无论是初始大了还是初始小了对我们HashMap的性能都不好装载因子初始值大了,可以减少散列表再散列(扩容的次数),但同时会导致散列冲突的可能性变大(散列冲突也是耗性能的一个操作,要得操作链表(红黑树)!
- 装载因子初始值小了,可以减小散列冲突的可能性,但同时扩容的次数可能就会变多!
初始容量的默认值是16,它也一样,无论初始大了还是小了,对我们的HashMap都是有影响的:
- 初始容量过大,那么遍历时我们的速度就会受影响~
- 初始容量过小,散列表再散列(扩容的次数)可能就变得多,扩容也是一件非常耗费性能的一件事~
从源码上我们可以发现:HashMap并不是直接拿key的哈希值来用的,它会将key的哈希值的高16位进行异或操作,使得我们将元素放入哈希表的时候增加了一定的随机性。
还要值得注意的是:并不是桶子上有8位元素的时候它就能变成红黑树,它得同时满足我们的散列表容量大于64才行的~