一、Java 集合

1、分类大纲
2、List基本介绍
3、Set基本介绍
4、Map基本介绍

1、分类大纲

java集合的基本分类请看processOn文件：https://www.processon.com/mindmap/627fbb0e5653bb45ea679561
如图：
Java集合.jpg

2、List基本介绍

单列元素。

2.1 ArrayList

特点：底层是elementData【】数组，查询块，增删慢，有序可重复，可以存储null值，线程不安全。
扩容机制：若使用无参构造器，则初始容量0，第一次添加，则扩容elementData为10，如需再次扩容，则扩容elementData为1.5倍；若使用有参构造器，则初始elementData容量为指定大小，如果需要扩容，则直接扩容elementData为1.5倍；扩容最终使用的Arrays.copyof()方法；最大容量Integer.MAX_VALUE - 8。

2.2 Vector

特点：和ArrayList基本一致，区别就是Vector是线程安全的，Vector 类的操作方法带有 ==synchronized==。
扩容机制：如果使用无参构造函数，默认10，满后，就按2倍扩容。如果指定大小，则每次直接按2倍扩容。

2.3 LinkedList

特点：LinkedList底层实现了双向链表。LinkedList中维护了两个属性 first 和 last 分别指向首节点和尾节点，每个节点（Node对象），里面又维护了prev、next、item、三个属性，其中通过prev指向前一个，通过next指向后一个节点。最终实现双向链表。
有序，可重复。查询慢，增删快。线程不安全。

3、Set基本介绍

单列元素。

3.1 HashSet

特点：底层是HashMap，而HashMap的底层是数组+单向链表+红黑树。无序，不能重复（好好看源码理解“不能重复”，对象一般可以重复，但是字符串不可重复，主要看元素的equals() 和 hashCode()方法），可以为null(仅有一个)，线程不安全。
第一次添加元素时，table数组扩容到16，临界值（threshold）是：16 0.75(loadFactor，加载因子）= 12。到达12后，再添加元素，会翻倍扩容到：162=32，新的临界值就是320.75 = 24，依次类推。
*扩容机制：

添加一个元素时，先得到hash值，再将hash值转化为索引值（放在数组的哪个位置）。
找到数据表，查看该索引的位置是否有元素。
若没有元素，则直接添加。若有元素，则调用equals()方法比较，如果相同，则不添加，若不同，则加在尾部（即链表里边）。
jdk8中，当链表中元素的个数达到8，同时数组中的个数超过64时，就会进化成红黑树（进一步提高查询效率）。注：若链表中元素的个数到8，而数组未到64，则按数组容量*2进行扩容，直到扩容到64，再树化。

3.2 LinkedHashSet
特点：LinkedHashSet是HashSet的子类。底层是LinkedHashMap，维护了一个数组+双向链表（这是它和HashSet的主要区别）。不允许重复，有序，线程不安全，。
特别说明：
在LinkedHashSet中维护了一个双向链表（有head和tail），每一个节点都有before和after属性，这样可以形成双向链表。
在添加元素时，先计算hash值，再计算索引，以确定元素在table的位置，然后将元素添加到双向链表（如果已存在，则不添加，和HashSet一样）。
由于双向链表的存在，我们插入元素和取出元素的顺序，是一致的。
3.3 TreeSet
特点：它的底层是TreeMap。
TreeMap底层是树形(红黑树)结构，作为Map的一员，包含着key—value形式的元素，和HashMap最大的区别是丢进去的东西自动排序。要注意的是默认的是对Key排序，也可以重写Comparator对Value排序，很方便。
4、Map基本介绍

双列元素。

4.1 HashMap

特点：这是我们工作中最经常用到的，用于保存具有映射关系的数据：Key-Value,底层是数组+单向链表+红黑树。Key不允许重复（相同则替换），可以为null（仅有一个），Value可以重复。无序。线程不安全。
扩容机制：跟HashSet一样（因为HashSet底层就是HashMap）

添加一个元素时，先得到hash值，再将hash值转化为索引值（放在数组的哪个位置）。
找到数据表，查看该索引的位置是否有元素。
若没有元素，则直接添加。若有元素，则调用equals()方法比较，如果相同，则替换，若不同，则加在尾部（即链表里边）。
jdk8中，当链表中元素的个数达到8，同时数组中的个数超过64时，就会进化成红黑树（进一步提高查询效率）。注：若链表中元素的个数到8，而数组未到64，则按数组容量*2进行扩容，直到扩容到64，再树化。（链表长度减到6会减枝）

扩容为什么是2的幂次方？
HashMap长度为2的幂次方的原因是为了减少Hash碰撞，尽量使Hash算法的结果均匀。
首先看一下HashMap中putVal方法的源码：

其中有个( n - 1) & hash的方法，那么这个方法是干什么的呢？
HashMap为了存取高效，就要尽量减少碰撞，将数据分配均匀，那么如何分配均匀，此时主要靠将数据存入到那个链表中的算法，这个算法就是( n - 1) & hash。& 是按位与运算，是一个位运算，而在计算机中位运算的效率很高，这就是不用%运算的原因。
按位与&的计算方式为当对应位置的数据都为1时，运算结果也为1。因此当HashMap的容量是2的幂次方时，( n - 1)的2进制都是111..11的形式，在与添加元素的hash值进行位运算时能够充分的散列，使添加的元素能均匀的分布在HashMap的每个位置上，减少hash碰撞。

4.2 Hashtable

特点：底层书数组+链表，初始容量为11，扩容加载因子0.75，键和值都不能为null，键不允许重复，相同则替换，线程安全。
扩容机制：
扩容后长度 = 扩容前table长度 * 2 +1

4.3 TreeMap

特点：TreeMap底层是树形(红黑树)结构，作为Map的一员，包含着key—value形式的元素，和HashMap最大的区别是丢进去的东西自动排序。要注意的是默认的是对Key排序，也可以重写Comparator对Value排序，很方便。