技巧:ArrayList删除元素时, 从尾部开始遍历,可大大提升执行效率

来源:互联网 发布:windows版五笔输入法 编辑:程序博客网 时间:2024/04/29 19:45

一.描述:

    1. 工作中,常常遇到这样的要求: 将列表里符合(或不符合)某条件的元素删除, 如:

        有列表list = [ "a", "b", "c", "d" ], 删除其中的"a", "b", "c"

    2. 关键在于遍历: 建议从尾部开始, 取代常规的从头部开始

    3. 有人会说 使用 LinkedList 更合适 -- 此处只考虑 ArrayList;

 

二.推断:

    当 list 删除元素 "a" 之后, 变为 [ "b", "c", "d" ], 猜想, list 内部数组发生变化(内存的变化):

        list(1) --> list(0),

        list(2) --> list(1),

        list(3) --> list(2),

        list(4)删除

   

    list(n):表示list内部数组的元素;

    -->    :表示复制到,或移动到

 

三.证明:

            查看源码java.util.ArrayList.remove()

   

Java代码  收藏代码
  1. public E remove(int index) {  
  2.         RangeCheck(index);  
  3.   
  4.         modCount++;  
  5.         E oldValue = (E) elementData[index];  
  6.   
  7.         int numMoved = size - index - 1;  
  8.         if (numMoved > 0)  
  9.             System.arraycopy(elementData, index + 1, elementData, index, numMoved);  
  10.         elementData[--size] = null// Let gc do its work  
  11.   
  12.         return oldValue;  
  13.     }  

            里面的System.arraycopy(),正是将 欲删除的元素 后面的 元素, 依次向前移动一个位置(内存), 最后再将

   最后一个元素删除(值空, 删除由GC处理).

            与预想的吻合.

 

四.分析:

    1.从list头部开始遍历:

       列表元素                            删除元素        操作后列表元素           内存移动次数

     ----------------------------------------------------------------------------------------------------

       [ "a", "b", "c", "d" ]             "a"            [ "b", "c", "d" ]         3

              [ "b", "c", "d" ]             "b"            [ "c", "d" ]                2

                     [ "c", "d" ]             "c"             [  "d" ]                     1

     ----------------------------------------------------------------------------------------------------

                               合计                                                              6

 

    2.从list尾部开始遍历:

       列表元素                            删除元素        操作后列表元素           内存移动次数

     ----------------------------------------------------------------------------------------------------

       [ "a", "b", "c", "d" ]             "c"            [ "a", "b", "d" ]         1

             [ "a", "b", "d" ]             "b"            [ "a", "d" ]                1

                    [ "a", "d" ]             "a"            [  "d" ]                      1

     ----------------------------------------------------------------------------------------------------

                               合计                                                              3

 

    3.综上两点, 从list尾部开始遍历 可以减少底层的操作次数, 提高程序执行得效率.

 

五.实践:

   

    此例, 删除了99999个元素(共100000), 免得有人投机取巧用clear,当然用clear是最快的,因为不涉及内存移动. 

 

Java代码  收藏代码
  1. import java.util.ArrayList;  
  2. import java.util.List;  
  3.   
  4. public class $ {  
  5.   
  6.     private static int MAX = 100000;  
  7.   
  8.     public static void main(String[] args) {  
  9.         System.out.println("容量:" + MAX);  
  10.         removeFromF();  
  11.         removeFromL();  
  12.     }  
  13.   
  14.     private static void removeFromF() {  
  15.   
  16.         List data = initData();  
  17.   
  18.         long l0 = System.currentTimeMillis();  
  19.         for (int i = 0; i < data.size() - 2; i++) {  
  20.             data.remove(i);  
  21.         }  
  22.         long l1 = System.currentTimeMillis();  
  23.   
  24.         System.out.println("从前往后remove(留下最后一个):" + (l1 - l0) + "MS");  
  25.     }  
  26.   
  27.     private static void removeFromL() {  
  28.   
  29.         List data = initData();  
  30.   
  31.         long l0 = System.currentTimeMillis();  
  32.         for (int i = data.size() - 2; i >= 0; i--) {  
  33.             data.remove(i);  
  34.         }  
  35.         long l1 = System.currentTimeMillis();  
  36.   
  37.         System.out.println("从后往前remove(留下最后一个):" + (l1 - l0) + "MS");  
  38.     }  
  39.   
  40.     private static List initData() {  
  41.         List data = new ArrayList();  
  42.         for (int i = 0; i < MAX; i++) {  
  43.             data.add(i);  
  44.         }  
  45.         return data;  
  46.     }  
  47. }  

 

    结果:

   

Java代码  收藏代码
  1. 容量:100000  
  2. 从前往后remove(留下最后一个):3596MS  
  3. 从后往前remove(留下最后一个):6MS  

 

   这耗时, 不是一个数量级的,随着数据增大, 差距越明显.

 

六.番外:

 

    随便记一下:

   

Java代码  收藏代码
  1. public E remove(int index) {  
  2.     RangeCheck(index);  
  3.   
  4.     modCount++;  
  5.     E oldValue = (E) elementData[index];  
  6.   
  7.     int numMoved = size - index - 1;  
  8.     if (numMoved > 0)  
  9.         System.arraycopy(elementData, index + 1, elementData, index, numMoved);  
  10.     elementData[--size] = null// Let gc do its work  
  11.   
  12.     return oldValue;  
  13. }  

 

   当做其删除操作时, list 内部数组的大小是没有变化的(假如此时GC尚未工作), 变化的只是size, 而在外部我们能得到的

是size, 最多也只能得到 0 ~ size-1 的元素.

 

七:扩展:

 

    手动删除excel列时,也建议 从后面开始删. 源码没有看过,是根据现象猜测的.

 

    举例:

    excel2007 (2003没试过,猜想应该是一样的)

    从A ~ BB列, 20000行数据, 删除其中的A列 和 BB列, 看看哪个快?

    有兴趣可试试....

原创粉丝点击