Java 集合 - List 集合问题 - 《Java 基础》

ArrayList
LinkedList
总结
- ArrayList 和 LinkedList 的区别、优缺点以及应用场景

ArrayList

ArrayList成员属性

//默认的空的数组，在构造方法初始化一个空数组的时候使用
private static final Object[] EMPTY_ELEMENTDATA = {};
//使用默认size大小的空数组实例
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
//ArrayList底层存储数据就是通过数组的形式，ArrayList长度就是数组的长度。
transient Object[] elementData; 
//arrayList的大小
private int size;

那么ArrayList底层数据结构是什么呢？

很明显，使用动态再分配的Object[]数组作为ArrayList底层数据结构了，既然是使用数组实现的，那么数组特点就能说明为什么ArrayList查询快而增删慢？
因为数组是根据下标查询不需要比较，查询方式为：首地址＋（元素长度＊下标），基于这个位置读取相应的字节数就可以了，所以非常快；但是增删会带来元素的移动，增加数据会向后移动，删除数据会向前移动，导致其效率比较低。

ArrayList默认大小是多少？

DEFAULT_CAPACITY = 10

ArrayList是如何扩容的？

根据当前的容量容纳不下新增数据时，ArrayList 会调用 grow 进行扩容：扩容为原来的 1.5 倍

//相当于int newCapacity = oldCapacity + oldCapacity/2
int newCapacity = oldCapacity + (oldCapacity >> 1);

为什么说 ArrayList 删除元素效率低？

删除数据需要将数据后面的元素数据迁移到新增位置的后面，这样导致性能下降很多

LinkedList

LinkedList的主要属性

//链表节点的个数 
transient int size = 0; 
//链表首节点
 transient Node<E> first; 
//链表尾节点
 transient Node<E> last; 
//Node节点内部类定义
private static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;
        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }

一旦变量被 transient 修饰，变量将不再是对象持久化的一部分，该变量内容在序列化后无法获得访问

LinkedList插入

由于LinkedList由双向链表作为底层数据结构，因此其插入无非由三大种

尾插： add(E e)、addLast(E e)、addAll(Collection<? extends E> c)
头插： addFirst(E e)
中插： add(int index, E element)

可以从源码看出，在链表首尾添加元素很高效，在中间添加元素比较低效，首先要找到插入位置的节点，在修改前后节点的指针。

尾插-add(E e)和addLast(E e)

//常用的添加元素方法
public boolean add(E e) {
    //使用尾插法
    linkLast(e);
    return true;
}
//在链表尾部添加元素
public void addLast(E e) {
        linkLast(e);
    }
//在链表尾端添加元素
void linkLast(E e) {
        //尾节点
        final Node<E> l = last;
        final Node<E> newNode = new Node<>(l, e, null);
        last = newNode;
        //判断是否是第一个添加的元素
        //如果是将新节点赋值给last
        //如果不是把原首节点的prev设置为新节点
        if (l == null)
            first = newNode;
        else
            l.next = newNode;
        size++;
        //将集合修改次数加1
        modCount++;
    }

头插-addFirst(E e)

public void addFirst(E e) {
    //在链表头插入指定元素
    linkFirst(e);
}

private void linkFirst(E e) {
            //获取头部元素,首节点
        final Node<E> f = first;
        final Node<E> newNode = new Node<>(null, e, f);
        first = newNode;
        //链表头部为空，（也就是链表为空）
        //插入元素为首节点元素
        // 否则就更新原来的头元素的prev为新元素的地址引用
        if (f == null)
            last = newNode;
        else
            f.prev = newNode;
        //
        size++;
        modCount++;
    }

中插-add(int index, E element)

 // 作用：在指定位置添加元素
    public void add(int index, E element) {
        // 检查插入位置的索引的合理性
        checkPositionIndex(index);

        if (index == size)
            // 插入的情况是尾部插入的情况：调用linkLast（）。
            linkLast(element);
        else
            // 插入的情况是非尾部插入的情况（中间插入）：linkBefore
            linkBefore(element, node(index));
    }

    private void checkPositionIndex(int index) {
        if (!isPositionIndex(index))
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

    private boolean isPositionIndex(int index) {
        return index >= 0 && index <= size;
    }

    void linkBefore(E e, Node<E> succ) {
        // assert succ != null;
        final Node<E> pred = succ.prev;  // 得到插入位置元素的前继节点
        final Node<E> newNode = new Node<>(pred, e, succ);  // 创建新节点，其前继节点是succ的前节点，后接点是succ节点
        succ.prev = newNode;  // 更新插入位置（succ）的前置节点为新节点
        if (pred == null)
            // 如果pred为null，说明该节点插入在头节点之前，要重置first头节点 
            first = newNode;
        else
            // 如果pred不为null，那么直接将pred的后继指针指向newNode即可
            pred.next = newNode;
        size++;
        modCount++;
    }

LinkedList 删除

删除和插入一样，其实本质也是只有三大种方式，

删除首节点: removeFirst()
删除尾节点: removeLast()
删除中间节点：remove(Object o)、remove(int index)

在首尾节点删除很高效，删除中间元素比较低效要先找到节点位置，再修改前后指针指引。

删除中间节点-remove(int index)和remove(Object o)

remove(int index) 和 remove(Object o) 都是使用删除指定节点的 unlink 删除元素

 public boolean remove(Object o) {
     //因为LinkedList允许存在null，所以需要进行null判断        
     if (o == null) {
         //从首节点开始遍历
         for (Node<E> x = first; x != null; x = x.next) {
             if (x.item == null) {
                 //调用unlink方法删除指定节点
                 unlink(x);
                 return true;
             }
         }
     } else {
         for (Node<E> x = first; x != null; x = x.next) {
             if (o.equals(x.item)) {
                 unlink(x);
                 return true;
             }
         }
     }
    return false;
 } 

//删除指定位置的节点，其实和上面的方法差不多
    //通过node方法获得指定位置的节点，再通过unlink方法删除
    public E remove(int index) {
        checkElementIndex(index);

        return unlink(node(index));
    }

 //删除指定节点
    E unlink(Node<E> x) {
        //获取x节点的元素，以及它上一个节点，和下一个节点
        final E element = x.item;
        final Node<E> next = x.next;
        final Node<E> prev = x.prev;
        //如果x的上一个节点为null，说明是首节点，将x的下一个节点设置为新的首节点
        //否则将x的上一节点设置为next，将x的上一节点设为null
        if (prev == null) {
            first = next;
        } else {
            prev.next = next;
            x.prev = null;
        }
        //如果x的下一节点为null，说明是尾节点，将x的上一节点设置新的尾节点
        //否则将x的上一节点设置x的上一节点，将x的下一节点设为null
        if (next == null) {
            last = prev;
        } else {
            next.prev = prev;
            x.next = null;
        }
        //将x节点的元素值设为null，等待垃圾收集器收集
        x.item = null;
        //链表节点个数减1
        size--;
        //将集合修改次数加1
        modCount++;
        //返回删除节点的元素值
        return element;
    }

删除首节点-removeFirst()

//删除首节点
public E remove() {
        return removeFirst();
    }
 //删除首节点
 public E removeFirst() {
      final Node<E> f = first;
      //如果首节点为null，说明是空链表，抛出异常
      if (f == null)
          throw new NoSuchElementException();
      return unlinkFirst(f);
  }
  //删除首节点
  private E unlinkFirst(Node<E> f) {
      //首节点的元素值
      final E element = f.item;
      //首节点的下一节点
      final Node<E> next = f.next;
      //将首节点的元素值和下一节点设为null，等待垃圾收集器收集
      f.item = null;
      f.next = null; // help GC
      //将next设置为新的首节点
      first = next;
      //如果next为null，说明说明链表中只有一个节点，把last也设为null
      //否则把next的上一节点设为null
      if (next == null)
          last = null;
      else
          next.prev = null;
      //链表节点个数减1
      size--;
      //将集合修改次数加1
      modCount++;
      //返回删除节点的元素值
      return element;
 }

删除尾节点-removeLast()

    //删除尾节点
    public E removeLast() {
        final Node<E> l = last;
        //如果首节点为null，说明是空链表，抛出异常
        if (l == null)
            throw new NoSuchElementException();
        return unlinkLast(l);
    }
    private E unlinkLast(Node<E> l) {
           //尾节点的元素值
        final E element = l.item;
        //尾节点的上一节点
        final Node<E> prev = l.prev;
        //将尾节点的元素值和上一节点设为null，等待垃圾收集器收集
        l.item = null;
        l.prev = null; // help GC
        //将prev设置新的尾节点
        last = prev;
        //如果prev为null，说明说明链表中只有一个节点，把first也设为null
        //否则把prev的下一节点设为null
        if (prev == null)
            first = null;
        else
            prev.next = null;
        //链表节点个数减1
        size--;
        //将集合修改次数加1
        modCount++;
        //返回删除节点的元素值
        return element;
    }

其他方法也是类似的，比如查询方法 LinkedList 提供了get、getFirst、getLast等方法获取节点元素值。

modCount 属性的作用？

modCount 属性标识结构性修改（改变 list 的 size 大小、以其他方式改变他导致正在进行迭代时出现错误的结果）的次数，该属性被 Iterator 以及 ListIterator 的实现类所使用，且很多非线程安全使用 modCount 属性。

初始化迭代器时会给这个 modCount 赋值，如果在遍历的过程中，一旦发现这个对象的 modCount 和迭代器存储的 modCount 不一样，Iterator 或者 ListIterator 将抛出 ConcurrentModificationException 异常，

这是jdk在面对迭代遍历的时候为了避免不确定性而采取的 fail-fast（快速失败）原则：

在线程不安全的集合中，如果使用迭代器的过程中，发现集合被修改，会抛出 ConcurrentModificationExceptions 错误，这就是 fail-fast 机制。对集合进行结构性修改时，modCount 都会增加，在初始化迭代器时，modCount 的值会赋给expectedModCount，在迭代的过程中，只要 modCount 改变了，int expectedModCount = modCount 等式就不成立了，迭代器检测到这一点，就会抛出错误：urrentModificationExceptions。

总结

ArrayList 和 LinkedList 的区别、优缺点以及应用场景

区别

ArrayList 是实现了基于动态数组的数据结构，LinkedList 是基于链表结构。
对于随机访问的 get 和 set 方法查询元素，ArrayList 要优于 LinkedList，因为 LinkedList 循环链表寻找元素。
对于新增和删除操作 add 和 remove，LinkedList 比较高效，因为 ArrayList 要移动数据。

优缺点：

对 ArrayList 和 LinkedList 而言，在末尾增加一个元素所花的开销都是固定的。对 ArrayList 而言，主要是在内部数组中增加一项，指向所添加的元素，偶尔可能会导致对数组重新进行分配；而对 LinkedList 而言，这个开销是统一的，分配一个内部 Entry 对象。
在 ArrayList 集合中添加或者删除一个元素时，当前的列表移动元素后面所有的元素都会被移动。而 LinkedList 集合中添加或者删除一个元素的开销是固定的。
LinkedList 集合不支持高效的随机随机访问（RandomAccess），因为可能产生二次项的行为。
ArrayList 的空间浪费主要体现在在 list 列表的结尾预留一定的容量空间，而 LinkedList 的空间花费则体现在它的每一个元素都需要消耗相当的空间（维护头尾指针）

应用场景:
ArrayList 使用在查询比较多，但是插入和删除比较少的情况，而 LinkedList 用在查询比较少而插入删除比较多的情况