一 前言
🏷 本文基于Java 11版本
Java 中的集合框架,涉及到大量的接口、类、异常类;以及各种的算法、数据结构、并发问题。工具类和工具方法也有不少。本文将逐一介绍这些内容。
Java 中 的集合是用于存储对象的工具类容器 , 它实现了常用的数据结构 , 提供了一系列公开的方法用于增加、删除、修改、查找和遍历数据,降低了日常开发成本。集合的种类非常多 , 形成了一个比较经典的继承关系树 , 称为 Java集合框架。
二 集合框架常见接口和实现
2.1 基本概述
Map接口:
图解:常用接口使用紫色标注,常用类使用橙色标注,不常用使用灰色标注,抽象层和其他都是红色标注。
首先可以看到 Collection 接口,继承于 Iterable 接口。这也就表明,只要是 Collection 这个类型,就可以进行迭代、并且可以进行 for-each 增强循环。
特别的,在 Java 8及其以上版本,增加了默认实现的 forEach 方法,可以进行迭代。
另外关于 Map 接口,它自己本身不继承任何接口。只是在定义一些方法时,依赖了 Collection 接口。
在日常的开发中,我们主要使用的是这些接口的实现类,也就是上图中黄色阴影框的 ArrayList ,LinkedList ,TreeSet , HashSet , LinkedHashSet , TreeMap , HashMap , LinkedHashMap 。本文的核心也就是围绕这些实现类来说明各个集合类的使用场景。
2.2 List 接口
📢 接口定义如下:
public interface List<E> extends Collection<E> {
}
List 集合通常是有序的,可以方便的知道上一个元素、下一个元素。一般是可以允许存储重复的元素。至于一个元素是否重复,需要用 Object 类的 equals 方法来判定。另外,List 集合的遍历结果是稳定的,也就是说它在不做任何额外操作(额外操作是指修改,删除,增加,排序等)时,每次遍历的结果都是一致的。
我们通常会使用它的实现类 ArrayList 和 LinkedList 。
2.2.1 ArrayList
📢 类的定义如下:
public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
private int size;
transient Object[] elementData;
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
private static final Object[] EMPTY_ELEMENTDATA = {};
private static final int DEFAULT_CAPACITY = 10;
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
}
}
public ArrayList(Collection<? extends E> c) {
Object[] a = c.toArray();
if ((size = a.length) != 0) {
if (c.getClass() == ArrayList.class) {
elementData = a;
} else {
elementData = Arrays.copyOf(a, size, Object[].class);
}
} else {
elementData = EMPTY_ELEMENTDATA;
}
}
}
ArrayList 的定义是:容量可以自我更改的、线程不安全集合。
其底层代码是使用了 Object 数组承载了数据,根据数据占整个集合的多少,进行扩容(其实是数组复制)。
可以看到 ArrayList 在定义时,实现了 RandomAccess 接口。表示支持快速随机访问。但是其在插入元素、删除元素时速度通常是很慢的,因为可能会移动其他元素。比如:在一个ArrayList中,存了10个元素,现在给它的第4个下标的位置插入一个新元素,那么从原先第4个元素开始,所有排在后边的元素都需要移动位置。
2.2.1.1 增加元素
ArrayList 在增加元素时,会存在一个扩容的操作。 整体的操作就是, 增加元素的代码如下:
private void add(E e, Object[] elementData, int s) {
if (s == elementData.length)
elementData = grow();
elementData[s] = e;
size = s + 1;
}
🎃 接下来看看 grow() 是如何进行扩容的!
private Object[] grow(int minCapacity) {
return elementData = Arrays.copyOf(elementData,
newCapacity(minCapacity));
}
private Object[] grow() {
return grow(size + 1);
}
🎃 接下来看看 newCapacity() 是如何进行计算新的容量的!
private int newCapacity(int minCapacity) {
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity <= 0) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
return Math.max(DEFAULT_CAPACITY, minCapacity);
if (minCapacity < 0)
throw new OutOfMemoryError();
return minCapacity;
}
return (newCapacity - MAX_ARRAY_SIZE <= 0)
? newCapacity
: hugeCapacity(minCapacity);
}
通过源码,我们观察到,在增加元素时涉及到的是数组复制、扩容。 ArrayList 还对外提供了一个插入的方法:
public void add(int index, E element) {
rangeCheckForAdd(index);
modCount++;
final int s;
Object[] elementData;
if ((s = size) == (elementData = this.elementData).length)
elementData = grow();
System.arraycopy(elementData, index,
elementData, index + 1,
s - index);
elementData[index] = element;
size = s + 1;
}
这里用到一个数组的复制的方法, System.arraycopy ,它和之前用的 Arrays.copyOf ,是不同的。 关于 System.arraycopy 的入参:
- 要复制的数组
- 要复制的起始索引
- 目标数组,也就是说这个方法需要额外提供一个数组
- 要复制的目标位置
- 复制的数组的长度
其实就是,从插入的位置开始,所有的元素都往后移动一个位置。
而 Arrays.copyOf 有所不同,它是直接就创建一个数组,返回给调用者。它需要的是要复制的数组以及新数组的长度作为参数即可。
2.2.1.2 删除元素
删除元素的流程是,先从集合容器中查找当前元素的所在索引。 查找这一步,需要遍历集合容器一次。
然后,根据索引,进行数组复制。 数组复制的方法也是使用了 System.arraycopy ,只是参数不同。此次的操作实质上是对数组进行“逆向复制”。即将要删除的元素的索引加1,作为复制的起始位置,而当前索引为复制的目标位置,做一个“所有元素全部往前移动一位”的操作。 方法定义如下:
private void fastRemove(Object[] es, int i) {
modCount++;
final int newSize;
if ((newSize = size - 1) > i)
System.arraycopy(es, i + 1, es, i, newSize - i);
es[size = newSize] = null;
}
2.2.1.3 修改元素
没有什么高大上的操作,仅仅是将指定的元素赋值给数组的指定索引位置。 修改的源码如下:
public E set(int index, E element) {
Objects.checkIndex(index, size);
E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}
2.2.1.4 查找元素
在 ArrayList 中,对外提供的有 indexOf 方法。
它其实是遍历了缓冲数组 elementData,逐一匹配。具体代码如下:
public int indexOf(Object o) {
return indexOfRange(o, 0, size);
}
int indexOfRange(Object o, int start, int end) {
Object[] es = elementData;
if (o == null) {
for (int i = start; i < end; i++) {
if (es[i] == null) {
return i;
}
}
} else {
for (int i = start; i < end; i++) {
if (o.equals(es[i])) {
return i;
}
}
}
return -1;
}
假如知道一个元素在 ArrayList 中的索引下标,可以直接使用 get(int index) 方法获取对应的元素。
另外如果仅仅需要判断容器中是否包含一个元素,有包装了 indexOf 方法的 contains 方法可以使用。在语义上能好理解些。
2.2.1.5 遍历ArrayList 的几种常见写法
package org.feng.demo;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.stream.IntStream;
public class ArrayListDemo {
public static void main(String[] args) {
List<Integer> integerList = new ArrayList<>(15);
IntStream.rangeClosed(1, 15).forEach(integerList::add);
for (Integer integer : integerList) {
System.out.println(integer);
}
int size = integerList.size();
for (int i = 0; i < size; i++) {
System.out.println(integerList.get(i));
}
integerList.forEach(System.out::println);
for (Iterator<Integer> iterator = integerList.iterator(); iterator.hasNext(); ) {
Integer currentElement = iterator.next();
System.out.println(currentElement);
}
Iterator<Integer> iterator = integerList.iterator();
while (iterator.hasNext()) {
Integer currentElement = iterator.next();
System.out.println(currentElement);
}
Object[] objects = integerList.stream().peek(System.out::println).toArray();
}
}
2.2.2 LinkedList
📢 类的定义如下:
public class LinkedList<E>
extends AbstractSequentialList<E>
implements List<E>, Deque<E>, Cloneable, java.io.Serializable
{
}
从类的定义上看,它实现了 List 接口,表示是一个有序列表(存入集合容器的顺序,就是遍历时的顺序)。
其次,LinkedList 实现了 Deque ,表示是一个双端链表。
那么和 ArrayList 不同,它并没有实现随机访问接口,因此无法通过索引直接快速获取元素。因为是一个链表,也就具备了链表数据结构的一些基本特性。
在查找元素时,需要从头结点往后遍历到最后一个元素,若匹配到目标元素,则会返回。在增加元素时,直接尾插法,链接到链表的最后一个元素的后继上。在删除元素时,直接使用其后继,链接到其前驱上即可。在修改时,也是先查找,再赋值。在插入元素时,和删除类似,只是将要插入的元素的前驱链接到插入位置的后继上,将插入位置的后一个元素的前驱,链接到插入元素的后继上。
内部定义了节点对象:
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
2.2.2.1 增加元素
🎃 实质上是创建一个新的 Node 对象,将新增加的元素,作为当前链表的最后一个元素的后继。
public boolean add(E e) {
linkLast(e);
return true;
}
void linkLast(E e) {
final Node<E> l = last;
final Node<E> newNode = new Node<>(l, e, null);
last = newNode;
if (l == null)
first = newNode;
else
l.next = newNode;
size++;
modCount++;
}
通过分析源码,我们知道了这个 LinkedList 的增加元素,时间是极小的,操作很简单。因此它的增加元素很快。
LinkedList 的插入方法是 add(int index, E element) ,表示将元素插入到index索引对应的位置。 其详细代码如下:
public void add(int index, E element) {
checkPositionIndex(index);
if (index == size)
linkLast(element);
else
linkBefore(element, node(index));
}
void linkBefore(E e, Node<E> succ) {
final Node<E> pred = succ.prev;
final Node<E> newNode = new Node<>(pred, e, succ);
succ.prev = newNode;
if (pred == null)
first = newNode;
else
pred.next = newNode;
size++;
modCount++;
}
Node<E> node(int index) {
if (index < (size >> 1)) {
Node<E> x = first;
for (int i = 0; i < index; i++)
x = x.next;
return x;
} else {
Node<E> x = last;
for (int i = size - 1; i > index; i--)
x = x.prev;
return x;
}
}
仔细分析后,插入的时间复杂度为 O(n/2),因为要遍历查找节点。
2.2.2.2 删除元素
2.2.2.3 修改元素
2.2.2.4 查找元素
2.2.2.5 遍历LinkedList 的几种常见写法
2.3 Set 接口
2.4 Map接口
2.5 Queue 接口
2.6 比较器 Comparator和Comparable
2.6.1 hashCode 和 equals 方法
2.7 数组&集合工具类
2.7.1 Arrays
2.7.2 Collections
2.7.3 集合&泛型
2.8 Fail-fast 机制
附录
Java 11 中文API文档
https://www.apiref.com/java11-zh/index.html
要找对应的Java类,可以在该页面顶部导航栏,搜索框搜索类名即可。比如本文中涉及到的 Collection、Set、Queue、Map等,都是可以直接搜索到的。
集合框架:
https://www.apiref.com/java11-zh/java.base/java/util/package-summary.html#CollectionsFramework
|