ArrayList源码分析&实现自己的ArrayList- 2022-01-10 23:00- java


一、源码分析&实现自己的ArrayList

  1. package com.learn.test.demo.list;
  2. import java.util.Arrays;
  3. import java.util.Collection;
  4. import java.util.ConcurrentModificationException;
  5. import java.util.Iterator;
  6. import java.util.List;
  7. import java.util.ListIterator;
  8. import java.util.NoSuchElementException;
  9. import java.util.Objects;
  10. /**
  11. * 实现自己的集合
  12. * 问题集合:
  13. * 1.为什么会有EMPTY_ELEMENTDATA和DEFAULTCAPACITY_EMPTY_ELEMENTDATA两个?
  14. * 2.为什么使用modCount统计修改次数作为修改校验?
  15. * 3.为什么迭代器里要校验是否做过修改?
  16. * 4.为什么扩容也要增加修改次数?迭代器获取数据时为什么要判断是否超过了数组的长度?
  17. *
  18. * @author Bai
  19. * @date 2021/11/24 21:03
  20. */
  21. public class MyList<E> implements List<E> {
  22. /**
  23. * 存储数据的元素
  24. */
  25. private Object[] element;
  26. /**
  27. * 初始容量
  28. */
  29. private Integer DEFAULT_CAPACITY = 10;
  30. /**
  31. * 最大容量
  32. */
  33. private Integer MAX_CAPACITY = Integer.MAX_VALUE - 8;
  34. /**
  35. * 当前数组存放的个数(element.length 代表的是数组的容量,也就是数组可以存多少个数据)
  36. */
  37. private int size;
  38. /**
  39. * 记录当前集合修改次数,该字段主要用于迭代器对比数据是否有修改
  40. */
  41. private int modCount;
  42. public MyList () {
  43. this.element = new Object[] {};
  44. }
  45. public MyList (Integer capacity) {
  46. if (capacity < 0) {
  47. throw new RuntimeException();
  48. }
  49. if (capacity == 0) {
  50. this.element = new Object[] {};
  51. } else {
  52. this.element = new Object[capacity];
  53. }
  54. }
  55. @Override
  56. public int size () {
  57. return size;
  58. }
  59. @Override
  60. public boolean isEmpty () {
  61. return size == 0;
  62. }
  63. @Override
  64. public boolean contains (Object o) {
  65. return indexOf(o) >= 0;
  66. }
  67. @Override
  68. public Iterator iterator () {
  69. return new MyItr();
  70. }
  71. @Override
  72. public Object[] toArray () {
  73. //使用新数组,不直接返回element,防止对element的数据干扰
  74. return Arrays.copyOf(element, size);
  75. }
  76. @Override
  77. public boolean add (E o) {
  78. //增加修改次数
  79. modCount++;
  80. //check是否需要对数组进行扩容,并执行扩容
  81. //为什么要传入size+1?因为size是当前数组存的数据个数,在加入新的数据时,需要判断数组是否有足够的长度来存放新加入的数据
  82. growCapacity(size + 1);
  83. //加入数据o前,element的size可以看作是n,最后一个数据的下标是数组长度-1,也就是n-1
  84. //加入数据o后:
  85. // 1.element的长度会加1,新size也就是n+1
  86. // 2.数组长度+1后,o会被放到数组最后一位(也就是+1的位置上),o所处的下标是原数组最后一个下标+1,也就是n(n-1+1)
  87. element[size++] = o;
  88. return true;
  89. }
  90. /**
  91. * 校验数组的容量是否满足,如果不满足按照以下规则扩容:
  92. * 1.首次扩容时使用初始容量
  93. * 2.非首次时,扩容按照原容量的1.5倍进行扩容
  94. * 3.进行边界校验,容量最大不超过Integer.Max
  95. *
  96. * @param needMinCapacity 需要的最小容量
  97. */
  98. private void growCapacity (int needMinCapacity) {
  99. //增加修改次数
  100. //todo 为什么修改时也要增加修改次数?白
  101. modCount++;
  102. //当前数组的容量不够时,进行扩容
  103. if (element.length - needMinCapacity > 0) {
  104. return;
  105. }
  106. //首次扩容使用默认容量
  107. if (DEFAULT_CAPACITY - needMinCapacity > 0) {
  108. needMinCapacity = DEFAULT_CAPACITY;
  109. }
  110. //原容量1.5倍库容
  111. int newMinCapacity = element.length + element.length >> 1;
  112. //如果扩容1.5倍后容量还是比需要的最小的容量小,则使用需要最小容量
  113. if (newMinCapacity - needMinCapacity > 0) {
  114. needMinCapacity = newMinCapacity;
  115. }
  116. //校验扩容边界
  117. if (needMinCapacity > MAX_CAPACITY) {
  118. needMinCapacity = Integer.MAX_VALUE;
  119. }
  120. // this.element = Arrays.copyOf(element, needMinCapacity);
  121. Object[] element = new Object[needMinCapacity];
  122. for (int i = 0; i < size; i++) {
  123. element[i] = this.element[i];
  124. }
  125. this.element = element;
  126. }
  127. @Override
  128. public boolean remove (Object o) {
  129. if (this.size == 0) {
  130. return false;
  131. }
  132. //单独判断null,是为了防止空指针
  133. if (null == o) {
  134. for (int i = 0; i < size; i++) {
  135. if (element[i] == null) {
  136. fastRemoveV1(i);
  137. return true;
  138. }
  139. }
  140. } else {
  141. for (int i = 0; i < size; i++) {
  142. if (o.equals(this.element[i])) {
  143. fastRemoveV2(i);
  144. return true;
  145. }
  146. }
  147. }
  148. return false;
  149. }
  150. private void fastRemoveV1 (int index) {
  151. //增加修改次数
  152. modCount++;
  153. //移除某个数据时,其实就是将要移除的数据之后的所有数据都向前移动一位
  154. //要移动的数据个数:
  155. // size是目前存放的所有数据的总数,index是数据所在数组中的下标,
  156. //size-index 减去不需要移动的个数,因为index是从0开始的,所有个数要多减去1
  157. int removeCount = size - index - 1;
  158. //无需移动
  159. if (removeCount < 1) {
  160. return;
  161. }
  162. //src:源数组
  163. // srcPos:开始复制的下标
  164. // dest:目标数组
  165. // destPos:目标数组起始的下标
  166. // length:要移动的个数
  167. System.arraycopy(element, index + 1, element, index, removeCount);
  168. //去除一个数据,size要-1,数组最后一位要置为空
  169. element[--size] = null;
  170. }
  171. private void fastRemoveV2 (int index) {
  172. //增加修改次数
  173. modCount++;
  174. //将要移除的元素后面的元素都往前移一位,将最后的元素置为null
  175. for (int i = index + 1; i < this.size; i++) {
  176. this.element[i - 1] = this.element[i];
  177. }
  178. this.element[--size] = null;
  179. }
  180. @Override
  181. public boolean addAll (Collection c) {
  182. //增加修改次数
  183. modCount++;
  184. Object[] src = c.toArray();
  185. //要添加的数组的长度
  186. int numb = src.length;
  187. //扩容校验:判断element的length是否足够存放c里的数据
  188. growCapacity(size + numb);
  189. //src: 数据源
  190. //srcPos: 从数据源哪个下标开始复制
  191. //element: 要复制到的数组
  192. //size:复制到数组时从哪个下标开始
  193. //numb:要复制的长度
  194. //整块内存移动复制
  195. System.arraycopy(src, 0, element, size, numb);
  196. size += numb;
  197. //System.arraycopy 没有返回值,要判断是否复制成功,可以以是否有需要复制的个数为主
  198. return numb != 0;
  199. }
  200. @Override
  201. public boolean addAll (int index, Collection c) {
  202. //索引边界校验
  203. rangeCheck(index);
  204. //增加修改次数
  205. modCount++;
  206. Object[] src = c.toArray();
  207. //要添加的数组的长度
  208. int numb = src.length;
  209. //扩容校验:判断element的length是否足够存放c里的数据
  210. growCapacity(size + numb);
  211. //src: 数据源
  212. //srcPos: 从数据源哪个下标开始复制
  213. //element: 要复制到的数组
  214. //size:复制到数组时从哪个下标开始
  215. //numb:要复制的长度
  216. //将index后的数据复制到后面,中间空出来存放src数组的长度
  217. System.arraycopy(element, index, element, index + numb, size - index - 1);
  218. //从index开始复制src长度的个数
  219. System.arraycopy(src, 0, element, index, numb);
  220. size += numb;
  221. //System.arraycopy 没有返回值,要判断是否复制成功,可以以是否有需要复制的个数为主
  222. return numb != 0;
  223. }
  224. @Override
  225. public void clear () {
  226. for (int i = 0; i < size; i++) {
  227. //清除引用释放资源,如果当前元素没有再被引用,就会引起GC回收
  228. this.element[i] = null;
  229. }
  230. }
  231. @Override
  232. public E get (int index) {
  233. rangeCheck(index);
  234. return (E)this.element[index];
  235. }
  236. @Override
  237. public E set (int index, E element) {
  238. rangeCheck(index);
  239. Object oldElement = this.element[index];
  240. this.element[index] = element;
  241. return (E)oldElement;
  242. }
  243. @Override
  244. public void add (int index, E element) {
  245. //索引边界校验
  246. rangeCheckForAdd(index);
  247. //增加修改次数
  248. modCount++;
  249. //扩容校验:判断element的length是否可以放下多一个元素
  250. growCapacity(size + 1);
  251. // addV1(index, element);
  252. addV2(index, element);
  253. }
  254. private void addV1 (int index, E element) {
  255. //src: 数据源
  256. //srcPos: 从数据源哪个下标开始复制
  257. //element: 要复制到的数组
  258. //size:复制到数组时从哪个下标开始
  259. //numb:要复制的长度
  260. //将index后的数据复制到后面,中间空出来存放src数组的长度
  261. System.arraycopy(this.element, index, this.element, index + 1, size - index - 1);
  262. this.element[index] = element;
  263. size += 1;
  264. }
  265. private void addV2 (int index, E element) {
  266. //循环将index后面的元素都往后移动一位
  267. for (int i = this.size; i > index; i--) {
  268. this.element[i] = this.element[i - 1];
  269. }
  270. this.element[index] = element;
  271. size++;
  272. }
  273. @Override
  274. public E remove (int index) {
  275. rangeCheck(index);
  276. //增加修改次数
  277. modCount++;
  278. Object oldValue = element[index];
  279. //计算要移动的元素个数:-index时减去的是个数,因为index是从0开始的,而size是统计的个数从1开始 与index相差了一个,所以需要-1
  280. int removeCount = size - index - 1;
  281. if (removeCount > 0) {
  282. System.arraycopy(element, index + 1, element, index, removeCount);
  283. }
  284. //移除一位元素时,则size-1,同时置为null,如果元素没有再被引用则会引起GC回收
  285. element[--size] = null;
  286. return (E)oldValue;
  287. }
  288. @Override
  289. public int indexOf (Object o) {
  290. if (size == 0) {
  291. return -1;
  292. }
  293. //为什么需要判null?因为这里比较时使用的equals,不判空否则会报nullPointE
  294. if (null == o) {
  295. for (int i = 0; i < size; i++) {
  296. if (this.element[i] == null) {
  297. return i;
  298. }
  299. }
  300. } else {
  301. for (int i = 0; i < size; i++) {
  302. if (o.equals(this.element[i])) {
  303. return i;
  304. }
  305. }
  306. }
  307. return -1;
  308. }
  309. @Override
  310. public int lastIndexOf (Object o) {
  311. int lastIndex = -1;
  312. if (null == o) {
  313. for (int i = 0; i < size; i++) {
  314. if (null == this.element[i]) {
  315. lastIndex = i;
  316. }
  317. }
  318. } else {
  319. for (int i = 0; i < size; i++) {
  320. if (o.equals(this.element[i])) {
  321. lastIndex = i;
  322. }
  323. }
  324. }
  325. return lastIndex;
  326. }
  327. @Override
  328. public ListIterator listIterator () {
  329. return new MyListItr();
  330. }
  331. @Override
  332. public ListIterator listIterator (int index) {
  333. return new MyListItr();
  334. }
  335. @Override
  336. public List<E> subList (int fromIndex, int toIndex) {
  337. rangeCheck(fromIndex);
  338. rangeCheck(toIndex);
  339. //增加修改次数
  340. modCount++;
  341. List<E> result = new MyList<>();
  342. for (int i = fromIndex; i < toIndex; i++) {
  343. result.add((E)this.element[i]);
  344. }
  345. return result;
  346. }
  347. @Override
  348. public boolean retainAll (Collection c) {
  349. Objects.requireNonNull(c);
  350. return batchRemove(c, true);
  351. }
  352. /**
  353. * 保留还是去除数据
  354. *
  355. * @param c 数据集合
  356. * @param complement true 保留 false 不保留
  357. * @return
  358. */
  359. private boolean batchRemove (Collection c, Boolean complement) {
  360. boolean result = false;
  361. //循环element时的下标
  362. int r = 0;
  363. //存放有效数据的下标
  364. int w = 0;
  365. try {
  366. //判断element里的元素是否在c中存在,如果存在的话,就往前存一下
  367. for (; r < size; r++) {
  368. //循环取element的每个元素,判断元素是否存在要保留或是要去除的集合里
  369. //complement:true 保留,false 不保留
  370. //c.contains(this.element[r]) == complement,有四种情况需要处理:
  371. //1.complement = true,保留并且element包含(true),则将数据往前移,保留数据
  372. //2.complement = true,保留并且element不包含(false),则不做任何处理,不保留数据
  373. //3.complement = false,不保留并且element包含(true),则不做任何处理,不保留数据
  374. //4.complement = false,不保留并且element不包含(false),则将数据往前移,保留数据
  375. //以上4种情况,只有1和4需要处理,也就是当true==true,false==false时才处理
  376. if (c.contains(this.element[r]) == complement) {
  377. this.element[w++] = this.element[r];
  378. }
  379. }
  380. } finally {
  381. //防止出现异常时,数组数据受到影响
  382. //如果r!=size 就表示循环没有正常执行完成,出现了异常,
  383. // 这时候需要整理未循环到的数据,以及将不需要保留的数据清除
  384. if (r != size) {
  385. //将r索引之后未循环到的数据前移到 w后,w前的数据都是循环过需要保留的数据
  386. System.arraycopy(element, r, element, w, size - r);
  387. //重新赋值w:正常执行完后会清空w后的数据,所以这里也要赋值w,不要清除未循环到的数据,以免丢失
  388. w += size - r;
  389. }
  390. //w=size:说明没有数据做了去除,所以不需要处理
  391. if (w != size) {
  392. //增加修改次数
  393. modCount++;
  394. //将w后的数据都去除
  395. for (int i = size; i >= w; i--) {
  396. this.element[i] = null;
  397. }
  398. //重新计算数组的size,这里w不需要+1,是因为w包含了当前元素的个数以及下个接下来要存放元素的下标
  399. size = w;
  400. result = true;
  401. }
  402. }
  403. return result;
  404. }
  405. @Override
  406. public boolean removeAll (Collection c) {
  407. Objects.requireNonNull(c);
  408. return batchRemove(c, false);
  409. }
  410. @Override
  411. public boolean containsAll (Collection c) {
  412. //方法一:最简单
  413. for (Object o : c) {
  414. if (!contains(o)) {
  415. return false;
  416. }
  417. }
  418. return true;
  419. //方法二:迭代器处理
  420. // Iterator iterator = c.iterator();
  421. // while (iterator.hasNext()) {
  422. // Object next = iterator.next();
  423. // if (contains(next)) {
  424. // continue;
  425. // }
  426. // return false;
  427. // }
  428. // return true;
  429. }
  430. @Override
  431. public Object[] toArray (Object[] a) {
  432. return null;
  433. }
  434. /**
  435. * 边界校验
  436. *
  437. * @param index
  438. */
  439. public void rangeCheck (int index) {
  440. if (index >= size || index < 0) {
  441. throw new ArrayIndexOutOfBoundsException();
  442. }
  443. }
  444. /**
  445. * 添加时边界校验
  446. *
  447. * @param index
  448. */
  449. public void rangeCheckForAdd (int index) {
  450. //添加时如果添加到最后一个索引也是允许的
  451. if (index > size || index < 0) {
  452. throw new ArrayIndexOutOfBoundsException();
  453. }
  454. }
  455. @Override
  456. public String toString () {
  457. if (size == 0) {
  458. return "[]";
  459. }
  460. StringBuilder sb = new StringBuilder();
  461. sb.append("[");
  462. int nullCnt = 0;
  463. for (int i = 0; i < size; i++) {
  464. if (null == this.element[i]) {
  465. nullCnt++;
  466. }
  467. }
  468. if (Objects.equals(nullCnt, size)) {
  469. return "[]";
  470. }
  471. for (int i = 0; i < size; i++) {
  472. if (i == size - 1) {
  473. sb.append(element[i]).append("]");
  474. } else {
  475. sb.append(element[i]).append(", ");
  476. }
  477. }
  478. return sb.toString();
  479. }
  480. public class MyItr implements Iterator<E> {
  481. /**
  482. * 下个元素的下标
  483. */
  484. int cursor;
  485. /**
  486. * 返回的最后一个元素的下标,默认-1
  487. */
  488. int lastRet = -1;
  489. /**
  490. * 集合操作次数,默认使用MyList的操作次数,该字段主要用来校验foreach时数组是否进行了修改
  491. */
  492. int expectedModCount = modCount;
  493. @Override
  494. public boolean hasNext () {
  495. return cursor != size;
  496. }
  497. @Override
  498. public E next () {
  499. //结构性修改校验
  500. checkForComodification();
  501. int index = cursor;
  502. if (index >= size) {
  503. throw new NoSuchElementException();
  504. }
  505. Object[] element = MyList.this.element;
  506. if (index >= element.length) {
  507. throw new ConcurrentModificationException();
  508. }
  509. //cursor++:继续计算下个元素的下标
  510. cursor++;
  511. //lastRet = cursor:下个元素的下标其实就是当前要取的值的下标,取完值后就变成了最后一个返回的元素下标,
  512. // 所以直接进将下个元素的下标直接赋值最后一个返回的元素下标是可以的
  513. return (E)element[lastRet = index];
  514. //下面的写法就是上面写法的简化版
  515. // return (E)MyList.this.element[lastRet = cursor++];
  516. }
  517. /**
  518. * 校验在foreach期间是否存在结构性修改
  519. * 结构性修改包括:添加/插入/删除,如果只是修改某个元素内容则不属于结构性修改
  520. */
  521. private void checkForComodification () {
  522. if (expectedModCount != modCount) {
  523. throw new ConcurrentModificationException();
  524. }
  525. }
  526. @Override
  527. public void remove () {
  528. //校验是否调用next接口
  529. if (lastRet < 0) {
  530. throw new IllegalStateException();
  531. }
  532. //结构性修改校验
  533. checkForComodification();
  534. //调用MyList的remove方法
  535. MyList.this.remove(lastRet);
  536. //cursor是下个元素的下标,lastRet是最后返回的下标,两者之间是差了1位,
  537. // 移除当前的元素后,后面的所有元素都会向前移动一位,也就是这些元素的索引都-1了,
  538. // 被移除元素后面一位元素也就重新移动到了当前移除元素的所有位置,也就是lastRet的位置是新的元素了
  539. // 而下个元素的索引位置也需要往前移动一位,因此:cursor = cursor -1 = lastRet
  540. cursor = lastRet;
  541. //因为元素被移除后就不存在这个元素对应的索引了,所以lastRet赋值为-1
  542. lastRet = -1;
  543. //重新赋值当前修改次数,与外部的修改次数保持一致
  544. expectedModCount = modCount;
  545. }
  546. }
  547. public class MyListItr extends MyItr implements ListIterator<E> {
  548. /**
  549. * 反向迭代 是否还有上一个
  550. *
  551. * @return
  552. */
  553. @Override
  554. public boolean hasPrevious () {
  555. return cursor != 0;
  556. }
  557. /**
  558. * 反向迭代 获取上一个元素
  559. *
  560. * @return
  561. */
  562. @Override
  563. public E previous () {
  564. int previousIndex = cursor - 1;
  565. if (previousIndex > size || previousIndex < 0) {
  566. throw new ArrayIndexOutOfBoundsException();
  567. }
  568. cursor = previousIndex;
  569. return (E)MyList.this.element[lastRet = previousIndex];
  570. }
  571. @Override
  572. public int nextIndex () {
  573. return cursor;
  574. }
  575. /**
  576. * 上一个元素的索引
  577. *
  578. * @return
  579. */
  580. @Override
  581. public int previousIndex () {
  582. return cursor - 1;
  583. }
  584. @Override
  585. public void set (E e) {
  586. MyList.this.set(cursor, e);
  587. }
  588. @Override
  589. public void add (E e) {
  590. //todo 这里为什么要=-1?
  591. lastRet = cursor;
  592. MyList.this.add(lastRet, e);
  593. expectedModCount = modCount;
  594. cursor++;
  595. }
  596. }
  597. }

二、ArrayList里使用到的设计模式

组合模式
迭代器模式

三、问题整理

1.modCount 的作用?

modCount记录的是 ArrayList结构性修改的次数。结构性修改也就是数组的长度或size发生了变化,例如当数组进行扩容、增加或删除元素时,数组的length和size都会发生改变。
modCount的主要作用是在ArrayList使用迭代器进行迭代时,用于检测当前迭代的数组是否发生了结构性变化。ArrayList中实现的迭代器保留了一份迭代时 当前数组的修改次数, 当迭代器中保留的modCount与ArrayList的modCount不一致时,就可以任务迭代的数组发生了修改 就会抛出异常 停止迭代。

2.为什么迭代器需要依赖modCount来判断数组是否发生了结构性变动?

这是因为迭代器在实现数组循环时采用了自己保留一份索引进行循环的方式,迭代器依赖自己保留的索引进行循环,或是查找当前迭代到的上个或下个元素,这就导致了如果迭代器保存的索引与数组本身的索引对不上时,就会在迭代中产生某些索引获取到的数据不一致的问题。