Java8 LinkedList源码分析

来源：互联网发布：vb.net chart控件使用编辑：程序博客网时间：2024/06/05 10:52

学习动机

Java Collection库中有三类：List，Queue，Set；而List接口，有三个子实现类：ArrayList，Vector，LinkedList。

LinkedList采用的双向链表结构，和ArrayList的数组结构不同，链表结构的优势就是便于大量的数据添加和删除，但对于ArrayList擅长的数据查询则并非擅长。

本文进行LinkedList源码的分析。

构造&成员属性

成员变量

    //容器的size    transient int size = 0;    //类似于指针，记录着链表的第一个数据    transient Node<E> first;    //连边的最后一个数据    transient Node<E> last;

看一下Node的内部：

private static class Node<E> {    E item;//存储的数据    Node<E> next;//指向链表的下一个数据    Node<E> prev;//链表的前一个数据    Node(Node<E> prev, E element, Node<E> next) {        this.item = element;        this.next = next;        this.prev = prev;    }}

我们可以看到，LinkedList的内部实际上是有若干个相连的Node节点组成的，每个Node节点都包含着该节点的数据、前一个节点、后一个节点。、

构造方法如下：

public LinkedList() {}public LinkedList(Collection<? extends E> c) {    this();    addAll(c);}

构造方法很简单，第二个构造中传入了一个Collection集合，也只是执行了addAll(c)方法。

add()方法分析

准备

照常理我们要尝试分析add()相关方法了，在这之前我们先看一下几个核心的元素插入方法：

private void linkFirst(E e)
void linkLast(E e)
void linkBefore(E e, Node succ)

  //将数据作为FirstNode插入链表    private void linkFirst(E e) {        //取得链表第一个元素        final Node<E> f = first;        //初始化数据,新建一个Node对象，该对象中数据为要插入的新数据        //同时，该数据的前一个节点为null(当然因为它是首个节点)        //该数据的后一个节点为之前的first节点        final Node<E> newNode = new Node<>(null, e, f);        first = newNode;        if (f == null)            //如果之前的首个节点（现在应该是第二个）为空，说明执行该插入操作前，链表为空            //新节点既是首节点，也是尾节点（因为现在链表元素size = 1）            last = newNode;        else            //否则说明之前不是空链表            //之前的首个节点的前一个节点变成新的首节点            f.prev = newNode;        size++;        modCount++;    }    //将数据作为LastNode插入链表    void linkLast(E e) {        final Node<E> l = last;        final Node<E> newNode = new Node<>(l, e, null);        last = newNode;        if (l == null)            first = newNode;        else            l.next = newNode;        size++;        modCount++;    }    //将数据插入到某个链表节点之前    void linkBefore(E e, Node<E> succ) {        // assert succ != null;        final Node<E> pred = succ.prev;        final Node<E> newNode = new Node<>(pred, e, succ);        succ.prev = newNode;        if (pred == null)            first = newNode;        else            pred.next = newNode;        size++;        modCount++;    }

理解任意一个核心方法,剩下两个方法也就不难理解了，我们以linkBefore为例：

步骤1：执行linkBefore时，LinkedList的数据结构
linkBefore1

步骤2：执行final Node newNode = new Node<>(pred, e, succ);
linkBefore2

步骤3：执行pred.next = newNode;
linkBefore3

add()方法

public boolean add(E e) {    //其实只是执行linkLast方法将数据添加到链表末尾    linkLast(e);    return true;}public void add(int index, E element) {    checkPositionIndex(index);    //将元素插入，也是执行了linklast或linkBefore方法    if (index == size)        linkLast(element);    else        linkBefore(element, node(index));}//将Collection中元素插入LinkedList最后public boolean addAll(Collection<? extends E> c) {    //如果我们在构造中传入一个Collection，实际会走下面的代码    return addAll(size, c);}//将Collection中元素插入LinkedList指定indexpublic boolean addAll(int index, Collection<? extends E> c) {    checkPositionIndex(index);//检查是否越界，若越界抛出IndexOutOfBoundsException异常    //先将集合转化为数组    Object[] a = c.toArray();    int numNew = a.length;    //如果数组为空，返回false，方法执行结束    if (numNew == 0)        return false;    Node<E> pred, succ;    if (index == size) {        //说明是通过构造初始化链表，此时链表中数据为空        succ = null;//succ: 索引位置从指定集合插入的第一个元素        pred = last;//pred: 插入数组的第一个元素节点    } else {        //node（index）方法是获取对应index的Node对象        succ = node(index);        pred = succ.prev;    }    //将数组中元素转换为一个链表，pred永远代表第一个Node节点    for (Object o : a) {        @SuppressWarnings("unchecked") E e = (E) o;        Node<E> newNode = new Node<>(pred, e, null);        if (pred == null)            first = newNode;        else            pred.next = newNode;        pred = newNode;    }    //将新的链表插入原有链表    if (succ == null) {        last = pred;    } else {        pred.next = succ;        succ.prev = pred;    }    //size修改，修改次数modCount++    size += numNew;    modCount++;    return true;}

add相关方法基本就这些，当然还有两个简单的，特此列出，不赘述:

public void addFirst(E e) {    linkFirst(e);}public void addLast(E e) {    linkLast(e);}

remove代码分析

先看一下remove相关的核心方法：

//删除第一个节点private E unlinkFirst(Node<E> f) {    final E element = f.item;    final Node<E> next = f.next;    f.item = null;    f.next = null; // help GC    first = next;    if (next == null)        last = null;    else        next.prev = null;    size--;    modCount++;    return element;}//删除last节点private E unlinkLast(Node<E> l) {    final E element = l.item;    final Node<E> prev = l.prev;    l.item = null;    l.prev = null; // help GC    last = prev;    if (prev == null)        first = null;    else        prev.next = null;    size--;    modCount++;    return element;}//删除某个节点E unlink(Node<E> x) {    // 临时保存移除对象的所有数据（prev和next指针以及存储数据）    final E element = x.item;    final Node<E> next = x.next;    final Node<E> prev = x.prev;    //prev指针为null，则说明该对象为头节点    if (prev == null) {        first = next;    } else {        prev.next = next;        x.prev = null;    }    //next指针为null，则说明该对象为尾节点    if (next == null) {        last = prev;    } else {        next.prev = prev;        x.next = null;    }    x.item = null;    size--;    modCount++;    return element;}

同样理解任意一个核心方法,剩下两个方法也就不难理解了，我们以unlink(Node x)为例：

步骤1：执行remove操作前的数据结构
linkBefore1

步骤2：执行prev指针相关
linkBefore2

步骤3：执行next指针相关
linkBefore3

remove代码分析

//按index删除节点很简单，node方法获取到对应的元素，然后unlink删除即可public E remove(int index) {    checkElementIndex(index);    return unlink(node(index));}//按对象删除，依次遍历链表，然后找到首个符合的元素，然后删除该元素public boolean remove(Object o) {    if (o == null) {        for (Node<E> x = first; x != null; x = x.next) {            if (x.item == null) {                unlink(x);                return true;            }        }    } else {        for (Node<E> x = first; x != null; x = x.next) {            if (o.equals(x.item)) {                unlink(x);                return true;            }        }    }    return false;}//同样没啥好说的，移除第一个Nodepublic E removeFirst() {    final Node<E> f = first;    if (f == null)        throw new NoSuchElementException();    return unlinkFirst(f);}//移除最后一个Nodepublic E removeLast() {    final Node<E> l = last;    if (l == null)        throw new NoSuchElementException();    return unlinkLast(l);}

node(int index)

我们来看一看node方法是如何找到对应index的元素节点的：

Node<E> node(int index) {    if (index < (size >> 1)) {        Node<E> x = first;        for (int i = 0; i < index; i++)            x = x.next;        return x;    } else {        Node<E> x = last;        for (int i = size - 1; i > index; i--)            x = x.prev;        return x;    }}

可以看到，类似于二分查找法，第一次查找根据index判断是从头部还是尾部获取对应元素，相对于数组结构，性能还是有所欠缺。

小结

优点：

LinkedList没有大小限制

没有浪费存储空间（Node节点的创建需要额外消耗少量空间）

add，remove等操作的空间消耗是固定的，不会造成对元素进行额外的移动拷贝

缺点：

除了对首尾元素外，对其他节点，进行add，remove，set，get等操作，都需要进行遍历查找的，时间复杂度为O(n)

应用场景

查询操作少，存储大量数据，可以考虑使用LinkedList

多线程下：

LinkedList和ArrayList一样，都不是线程安全的。

在考虑线程安全的情况下，可以使用 ConcurrentLinkedQueue代替LinkedList，直接同步LinkedList对象，或者使用

List list = Collections.synchronizedList(new LinkedList(…));

对比ArrayList

ArrayList和LinkedList的大致区别如下:
* 1.ArrayList是实现了基于动态数组的数据结构，LinkedList基于链表的数据结构。
* 2.对于随机访问get和set，ArrayList优于LinkedList，因为LinkedList要移动指针遍历查找。
* 3.对于新增和删除操作add和remove，LinedList比较占优势，因为ArrayList要移动数据。

当我们在集合中装5万条数据，测试运行结果如下:

显然我们可以看出ArrayList更适合读取数据，linkedList更多的时候添加或删除数据。

ArrayList内部是使用可増长数组实现的，所以是用get和set方法是花费常数时间的，但是如果插入元素和删除元素，除非插入和删除的位置都在表末尾，否则代码开销会很大，因为里面需要数组的移动。
LinkedList是使用双链表实现的，所以get会非常消耗资源，除非位置离头部很近。但是插入和删除元素花费常数时间。

参考文档

http://www.fx114.net/qa-226-155160.aspx
http://www.cnblogs.com/huzi007/p/5550440.html

阅读全文

0 0