STL中各种容器的删除操作

来源：互联网发布：mysql数据库主从复制编辑：程序博客网时间：2024/05/20 12:46

在应用中，我们通常不可避免地要对容器中的某些特定元素进行删除操作。这看起来并不是什么困难的问题。我们先写一个循环来迭代容器中的元素，如果迭代元素是要删除的元素，则删除之。代码如下所示：

vector<int> intContainer;  ..... for(vector<int>::iterator is = intContainer.begin();        it != intContainer.end();        ++it)  {          if ( *it == 25)                       intContainer.erase(it);  }

写出此代码的原意是将vector中值为25的元素删除，但不幸的是，这样做是错误的，这么做会带来诡异的未定义行为。因为当一个容器的一个元素被删除时，指向那个元素的所有迭代器将失效。当intContainer.erase(it)返回时，it已经失效。在for循环中对于失效的it执行自增操作，这是一件多么不靠谱的事情啊。既然这样行不通，那么我们可以求助于STL提供的remove算法。借助remove算法来达到删除元素的目的。

vector<int> intContainer;  .....size_t before_size = intContainer.size();  remove(intContainer.begin(), intContainer.end(), 25);  size_t after_size = intContainer.size();

运行程序以后发现before_size和after_size是一样的，说明元素并没有被真正删除。写出以上程序，是处于对remove算法的不了解而致。STL中remove算法会将不该删除的元素前移，然后返回一个迭代器，该迭代器指向的是那个应该删除的元素，仅此而已。所以如果要真正删除这一元素，在调用remove之后还必须调用erase，这就是STL容器元素删除的"erase_remove"的惯用法。

vector<int> intContainer;  .....intContainer.erase( remove(intContainer.begin(),            intContainer.end(), 25),        intContainer.end());

erase-remove的惯用法适用于连续内存容器，比如vector,deque和string，它也同样适用于list，但是并不是我们推荐的方法，因为使用list成员函数remove会更高效，代码如下：

 list<int> list_int;   ....   list_int.remove(25);

如果是关联容器呢？标准关联容器没有remove成员函数，使用STL算法的remove函数时编译同不过。所以上述remove形式对于标准关联容器并不适用。在这种情况下，解决办法就是调用erase：

map<int, int> mapContainer;  ...  mapContainer.erase(25);

对于标准关联容器，这样的元素删除方式是简单有效的，时间复杂度为O(logn).

当我们需要删除的不是某一个元素，而是具备某一条件的元素的时候，我们只需要将remove替换成remove_if即可

bool Is2BeRemove(int value)  {          return value < 25;  }  vector<int> nVec;  list<int> nList;  ....  nVec.erase(remove_if(nVec.begin(), nVec.end(), Is2BeRemove),        nVec.end());  nList.remove_if(Is2BeRemove);

总结如下

删除容器中具有特定值的元素：

如果容器是vector、string或者deque，使用erase-remove的惯用法。如果容器是list，使用list::remove。如果容器是标准关联容器，使用它的erase成员函数。

删除容器中满足某些条件的元素：

如果容器是vector、string或者deque，使用erase-remove_if的惯用法。如果容器是list，使用list::remove_if。如果容器是标准关联容器，使用remove_copy_if&swap 组合算法，或者自己设计个遍历删除算法。

重点提一下以下内容，学完aoj0121有感

STL的remove函数和list的remove成员函数

今天看书刚刚看的，就记录下来吧。这可能是老生常谈了，权且作为一个警醒的例子吧。

大家都知道STL有两个非常重要的组成部分，容器和算法。

算法就是一个个的函数，通过迭代器和容器关联在一起，完成一些工作。

算法和容器的分离为程序设计提供了很大的灵活性，但是也带来了一些负面效果，下面我讲的这个问题就是一个例子。

STL的算法里有一个remove函数，而list自身也有一个remove函数，功能都是一样的，移除某一个元素，那我们应该使用哪一个呢？

看一下下面这段程序

<span style="font-size:14px;">list<int> numbers;    for ( int number = 0; number <= 6; number ++ ) {        numbers.push_front(number);        numbers.push_back(number);    }    copy(numbers.begin(), numbers.end(),            ostream_iterator<int>(cout, " "));    cout << endl;    // remove algorithm will remove element but not erase the element from container    // it will return the logical desination of container    list<int>::iterator endOfNumbers = remove(numbers.begin(), numbers.end(), 3);    copy(numbers.begin(), numbers.end(),            ostream_iterator<int>(cout, " "));    cout << endl;</span>

输出是什么呢？

第一行肯定是6 5 4 3 2 1 0 0 1 2 3 4 5 6，那么第二行会输出什么？

如果是没有仔细看过STL的人肯定会认为remove(number.begin(), numbers.end(), 3)会移除所有值为3的元素。所以输出是：6 5 4 2 1 0 0 1 2 4 5 6。

但是，我们看一下它真正的输出：

6 5 4 2 1 0 0 1 2 4 5 6 5 6

你可能会非常惊讶，为什么最后会多出5和6两个数呢？

我们来讲一下remove算法的原理。

remove算法工作时并不是直接把元素删除，而是用后面的元素替代前面的元素，也即是说如果我对1234这个序列remove 2，返回的序列是 1344（3被复制到2的位置，4被复制到3的位置）。

这样上面的例子就好解释了，那两个3的元素并没有被移除，而是用后面的元素覆盖了前面的元素。多出的那两个数没有被移除掉而已。

那么我们应该如何真正完成移除呢？remove函数会返回一个迭代器，那个迭代器是这个序列的逻辑终点，也即是我代码里的endOfNumbers，它指向倒数第二个5上。

于是我们要利用list的erase函数完成元素移除

numbers.erase(endOfNumbers, numbers.end());

这样我们就完成了我们的工作，稍稍有点曲折……

其实我们可以把这两步放在一起，比如如果我想接着移除所有值为2的元素

numbers.erase(remove(numbers.begin(), numbers.end(), 2), numbers.end());

这样我们就可以一步到位了。

但是这样好么？

不好。

大家会发现，remove函数的原理是复制而不是指针的移动（因为函数操纵的是迭代器，而C++的迭代器没有定义删除操作），这样会带来一个问题：我们使用list是因为它的修改的效率非常高，改变一下指针就可以了。而这里我们复制了元素，如果在vector中，可能还是高效的，因为vector无论如何都要复制，而对于list就不是如此了，会极度降低我们的效率。

那我们怎么办呢？

答案是使用list自己的remove函数

numbers.remove(1);

我们可以这样删除所有值为1的元素。

也即是说，如果要删除list中的元素，我们应该使用list的remove成员函数，而不是remove算法！

小结

我们都知道，STL是一个效率、复用性、灵活性折衷的产物，其中效率至关重要，所以STL已经禁止了一些效率低的操作（比如list的随机访问），而鼓励你去使用其它的容器。

但是，在算法中，为了灵活性，STL还是会牺牲一些东西，比如我们这个例子。

个人觉得，STL作为C++标准库的一个组成部分，特点和C++本身一模一样，强大而复杂，有些地方难以理解，很多细节需要学习注意，我们要学会避免陷入某些陷阱之中，比如这个例子就是一个效率陷阱。

其它更多的陷阱是错误处理方面的，STL本身并没有规定过多的错误处理，大部分的错误处理都交给了我们，理由很简单：性能至上，如果一个东西自身没有错误检查，我们可以包装一个带错误检查的类；但是如果这个东西自身就带了错误检查，那么我们就没有任何方法提升它的效率了。这也是很多C和C++库的设计原则。

所以，很多时候，需要我们深入细节，然后再决定到底怎么做。因为C++就是如此：有很多路可以走，需要我们自己选择最好的一条路。

0 0