Java 从源码弄懂集合(超详细)-List篇
前言
集合是我们在开发中经常会使用的工具,不同的集合实现类有着不同的特性,而很多开发者却一个ArrayList从头用到尾,这种做法是非常不可取的,所以我决定写一篇博客全面记录集合的各个实现类已经用法
一、概述
以下是集合的框架图
由上图可知,我们的集合的顶层接口是Iterable被Collectionb继承,而List,Queue,Set则是Collection接口的三个最主要的子接口。
二、Iterable
Iterable是一个迭代器接口,它的作用是方便我们对集合进行遍历
源码如下:
import java.util.function.Consumer;
public interface Iterable<T> {
//iterator()方法
Iterator<T> iterator();
default void forEach(Consumer<? super T> action) {
Objects.requireNonNull(action);
for (T t : this) {
action.accept(t);
}
}
default Spliterator<T> spliterator() {
return Spliterators.spliteratorUnknownSize(iterator(), 0);
}
}可以看出来,Iterable支持lambda函数接口,还需要注意的是它的forEach方法,我们可以看到它的参数是个Consumer类型的,所以在forEach内部我们常常用lambda特性来创建匿名接口实现对象
//Hero的属性:name、hp,仅包含get和set方法
List<Hero> list = new ArrayList<>();
list.add(new Hero("xie",100));
list.add(new Hero("li",100));
list.add(new Hero("guo",100));
//forEach遍历方式
//示例1和2代码本质是一样的,但是1更加简洁
//示例1
list.forEach((item) ->{
System.out.println(item.getName());
});
//示例2
list.forEach(new Consumer<Hero>() {
@Override
public void accept(Hero item) {
System.out.println(item.getName());
}
});
//迭代器遍历方式
//集合的实现类都重写了iterator方法,我们可以执行此方法返回一个迭代器
Iterator iterator = list.iterator();
while(iterator.hasNext()){
Hero next = (Hero) iterator.next();
System.out.println(next.getName());
}由上面的代码可以看出,Iterator对象两个最常用的方法是hasNext()和next(),一个是用来判断容器中是否还有元素,一个是返回当前元素的下一个元素
三、Collection
该接口的源码就不给大家展示了,我们只需要知道该接口声明的常用方法即可
1. 增
boolean add(E e);
boolean addAll(Collection<? extends E> c);
2. 删
boolean remove(Object o);
boolean removeAll(Collection<?> c);
default boolean removeIf(Predicate<? super E> filter)
3. 子集
boolean contains(Object o);
boolean containsAll(Collection<?> c);
4. 交集
boolean retainAll(Collection<?> c);
5. 转成数组
<t> T[] toArray(T[] a);
Object[] toArray();
这两种toArray方法的返回类型是不一样的!!!</t>
6. 其它常用api
void clear();
int size();
boolean isEmpty();
四、ArrayList
ArrayList是List接口的实现类,它的特点是有序,所以它能通过索引来进行增删改查。
- 增:add(E e) addAll(Collection<? extends E> c);
- 删:remove(int index) remove(E obj) removeAll(Collection col);
- 改:set(int index, E e);
- 查:get(int index);
- 插:add(int index, E e) addAll(int index, Collection<? extends E> c);
- 长度:size();
ArrayList最大的特点就是会自动扩充,那它扩充的机制到底是怎样的呢?我们来分析源码
ArrayList基本属性和构造方法
public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
//序列化的ID
private static final long serialVersionUID = 8683452581122892189L;
//初始化大小为10
private static final int DEFAULT_CAPACITY = 10;
//当size为0时,赋值给elementData的空数组
private static final Object[] EMPTY_ELEMENTDATA = {};
//调用无参构造函数时用到的空数组,跟上面那个空数组的使用场景不同而已
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
//真正用来存储数据的数组
transient Object[] elementData; // non-private to simplify nested class access
//存放元素的个数
private int size;
//初始化指定大小容量的数组
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
//在该场景下elementData指向EMPTY_ELEMENTDATA
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
//无参构造函数
public ArrayList() {
//该场景下elementData指向的是DEFAULTCAPACITY_EMPTY_ELEMENTDATA
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
//传入一个集合并将其初始化为ArrayList
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
//当c不为空集合时,将elementData的类型强制转为Object[]
if ((size = elementData.length) != 0) {
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
//将elementData的长度变为size
public void trimToSize() {
modCount++;
if (size < elementData.length) {
elementData = (size == 0)
? EMPTY_ELEMENTDATA
: Arrays.copyOf(elementData, size);
}
}
//确保elementData容量够用,不够则扩容
public void ensureCapacity(int minCapacity) {
//minCapacity>elementData长度且elementData不指向DEFAULTCAPACITY_EMPTY_ELEMENTDATA
//或minCapacity>默认值(10)时扩容
if (minCapacity > elementData.length
&& !(elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
&& minCapacity <= DEFAULT_CAPACITY)) {
modCount++;
grow(minCapacity);
}
}
}ArrayList添加元素
//向数组尾部添加元素
private void add(E e, Object[] elementData, int s) {
if (s == elementData.length)
elementData = grow();
elementData[s] = e;
size = s + 1;
}
public boolean add(E e) {
modCount++;
add(e, elementData, size);
return true;
}
//插入元素
public void add(int index, E element) {
rangeCheckForAdd(index);
modCount++;
final int s;
Object[] elementData;
if ((s = size) == (elementData = this.elementData).length)
elementData = grow();
System.arraycopy(elementData, index,
elementData, index + 1,
s - index);
elementData[index] = element;
size = s + 1;
}ArrayList扩容
//返回一个适合的大小给数组
private static int calculateCapacity(Object[] elementData, int minCapacity) {
/**
当调用无参构造器 elementData指向DEFAULTCAPACITY_EMPTY_ELEMENTDATA的时候
会返回默认大小和minCapacity的最大值
**/
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
//DEFAULT_CAPACITY是10
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
//将newCapacity扩大成oldCapacity的1.5倍
int newCapacity = oldCapacity + (oldCapacity >> 1);
//若此时newCapacity还小于minCapacity则直接将minCapacity赋值给newCapacity
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
//若此时newCapacity>MAX_ARRAY_SIZE,则调用hugeCapacity(minCapacity)
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// 将原数组的内容赋值给扩容后的新数组
elementData = Arrays.copyOf(elementData, newCapacity);
}五、LinkedList
LinkedList是一个非常强大的实现类,它既实现了List的接口,又实现了DeQue(双端队列)的接口。
LinkedList结构
public class LinkedList<E>
extends AbstractSequentialList<E>
implements List<E>, Deque<E>, Cloneable, java.io.Serializable
{
transient int size = 0;
/**
* Pointer to first node.
*/
transient Node<E> first;
/**
* Pointer to last node.
*/
transient Node<E> last;
......
}可以看出LinkedList有一个头指针first和一个尾指针last,也就是我们数据结构里面的双端队列的逻辑结构。在Java中,传统的队列Queue 添加元素是在队尾添加,删除或取出元素是在队头进行操作,而LinkedList作为双端队列既可以在队头进行添加或删除,也可以在队尾进行添加和删除
Node的结构(LinkedList内部类)
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}可以看出Node对象具有next和prev两个指针,一个指向前,一个指向后,所以由Node结点组成的LinkedList不但是一个双端队列,还是个双链表
常用api
LinkedList<Hero> list = new LinkedList<>();、
//往队尾添加元素
list.offer(new Hero("1号",1));
list.offer(new Hero("2号",1));
list.offer(new Hero("3号",1));
//往队首添加元素
list.offerFirst(new Hero("4号",1));
list.offerFirst(new Hero("5号",1));
list.offerFirst(new Hero("6号",1));
//取出队尾元素:3号
System.out.println(list.peekLast().getName());
//取出队首元素:6号
System.out.println(list.peekFirst().getName());
//删除队首
System.out.println("删除队首:" + list.pollFirst().getName());
//删除队尾元素
System.out.println("删除队尾:" + list.poll().getName());以上是LinkedList作为DeQue实现类具有的api,除此之外LinkedList还实现了List接口中的方法,具体可以参考上面的ArrayList常用api,在此不再赘述
六、总结
在上面我们主要谈到了Iterator、Collection、以及List的两个实现类ArrayList和LinkedList,下面我们就来总结一下它们各自的功能以及特点吧
1. Iterator:迭代器对象,用来遍历集合,next()用来得到下一个元素,hasNext()判断集合是否遍历结束。
注意点:一个Iterator对象只能遍历一遍,若要遍历第二遍则需要重新创建该集合的Iterator
2. List:一个有序的集合接口,它可以通过索引来进行插入,删除,访问
3. ArrayList:它是List的实现类,开发中我们通常使用它来代替数组,需要注意的是它的底层是Object数组,默认大小是10,当添加元素的时候会判断它的容量是否够用,若不够的话则扩容为1.5倍大小,若还不够,则将其扩容为需要的大小
4. LinkedList:它实现了List接口和DeQue接口,具有它们两者的特性,除此之外它的结构是一个双端队列,可以从队头/队尾添加、删除、访问元素
ArrayList和LinkedList区别:
它们的区别由它们底层的数据结构所决定,由于ArayList底层是object数组,所以它具有随机访问特性,更适合查询业务比较多的场景,而LinkedList本质上是一个双链表,它更适合插入删除比较多的业务场景。
