转 C++ iterator迭代器简介

来源：互联网发布：淘宝刷钻平台源码 php 编辑：程序博客网时间：2024/05/04 04:32

原文地址：C++ iterator迭代器简介">转 C++ iterator迭代器简介作者：__one_day__

除了使用下标来访问vector对象的元素外，标准库还提供了另一种检测元素的方法：使用迭代器（iterator）。迭代器是一种允许程序员检查容器内元素，并实现元素遍历的数据类型。
　　标准库为每一种标准容器（包括vector）定义了一种迭代器类型。迭代器类型提供了比下标操作更一般化的方法：所有的标准库容器都定义了相应的迭代器类型，而只有少数的容器支持下标操作。因为迭代器对所有的容器都适用，现代C++程序更倾向于使用迭代器而不是下标操作访问容器元素，即使对支持下标操作的vector类型也这样。

　　1.容器的iterator类型
　　每种容器类型都定义了自己的迭代器类型，

如vector：
　　vector<int>::iteratoriter;
　　这条语句定义了一个名为iter的变量，它的数据类型是由vector<int>定义的iterator类型。

如map：

map<int,char*>::iterator iter;;

这条语句定义了一个名为iter的map<int,char*>类型的迭代器

每个标准库容器类型都定义了一个名为iterator的成员，这里的iterator与迭代器实际类型的含义相同。
　　术语：迭代器和迭代器类型
　　程序员首次遇到有关迭代器的术语时可能会困惑不解，产生困惑的原因之一是由于本书中同一个术语iterator表示两个不同的事物。一般性提及的是迭代器的概念；而特别提及的则是由容器定义的具体的iterator类型，如vector<int>。
　　重点要理解的是，定义了许多用作迭代器的类型，这些类型在概念上是相关的。若一种类型支持一组确定的行为（这些行为允许程序员遍历容器内的元素，并允许程序员访问这些元素值），我们就称这种类型为迭代器。
　　不同的容器类定义了自己的iterator类型，用于访问容器内的元素。换句话说，每个容器定义了一种名为iterator的类型，而这种类型支持（概念上的）迭代器的各种行为。　　
　　2. begin和end操作
　　每种容器都定义了一对命名为begin和end的函数，用于返回迭代器。如果容器中有元素的话，由begin返回的迭代器指向第一个元素：
　　vector<int>::iterator iter =ivec.begin();
　　上述语句把iter初始化为由名为ivec的vector进行begin操作返回的值。假设vector不空，初始化后，iter即指该元素为ivec[0]。
　　由end操作返回的迭代器指向vector的“末端元素的下一个”。通常称为超出末端迭代器(off-the-enditerator)，表明它指向了一个不存在的元素。如果vector为空，begin返回的迭代器与end返回的迭代器相同。
　　由end操作返回的迭代器并不指向vector中任何实际的元素，相反，它只是起一个哨兵（sentinel）的作用，表示我们已处理完vector中所有元素。
　　3. vector迭代器的自增和解引用运算
　　迭代器类型定义了一些操作来获取迭代器所指向的元素，并允许程序员将迭代器从一个元素移动到另一个元素。
　　迭代器类型可使用解引用操作符（*操作符）来访问迭代器所指向r元素：
　　*iter = 0;
　　解引用操作符返回迭代器当前所指向的元素。假设iter指向vector对象ivec的第一个元素，那么*iter和ivec[0]就是指向同一个元素。上面这个语句的效果就是把这个元素的值赋为0。

对于map的迭代器，*iter指向的是一个pair对象，其中first拥有键，second拥有值。
　　迭代器使用自增操作符（1.4.1节）向前移动迭代器指向容器中下一个元素。从逻辑上说，迭代器的自增操作和int型对象的自增操作类似。对int对象来说，操作结果就是把int型值“加1”，而对迭代器对象则是把容器中的迭代器“向前移动一个位置”。因此，如果iter指向第一个元素，则++iter指向第二个元素。
　　由于end操作返回的迭代器不指向任何元素，因此不能对它进行解引用或自增操作。
　　4. 迭代器的其他运算
　　另一对可执行于迭代器的操作就是比较：用==或!=操作符来比较两个迭代器，如果两个迭代器对象指向同一个元素，则它们相等，否则就不相等。
　　5. 迭代器应用的程序示例
　　假设已声明了一个vector<int>型的ivec变量，要把它所有元素值重置为0，可以用下标操作来完成：
　　// reset all the elements in ivec to 0
　　for (vector<int>::size_type ix = 0;ix != ivec.size(); ++ix)
　　ivec[ix] = 0;
　　上述程序用for循环遍历ivec的元素，for循环定义了一个索引ix，每循环迭代一次ix就自增1。for循环体将ivec的每个元素赋值为0。
　　更典型的做法是用迭代器来编写循环：
　　// equivalent loop using iterators to reset all the elements inivec to 0
　　for (vector<int>::iterator iter =ivec.begin();
　　iter != ivec.end(); ++iter)
　　*iter = 0; // set element to which iter refers to 0
　　for循环首先定义了iter，并将它初始化为指向ivec的第一个元素。for循环的条件测试iter是否与end操作返回的迭代器不等。每次迭代iter都自增1，这个for循环的效果是从ivec第一个元素开始，顺序处理vector中的每一元素。最后，iter将指向ivec中的最后一个元素，处理完最后一个元素后，iter再增加1，就会与end操作的返回值相等，在这种情况下，循环终止。
　　for循环体内的语句用解引用操作符来访问当前元素的值。和下标操作符一样，解引用操作符的返回值是一个左值，因此可以对它进行赋值来改变它的值。上述循环的效果就是把ivec中所有元素都赋值为0。
　　通过上述对代码的详细分析，可以看出这段程序与用下标操作符的版本达到相同的操作效果：从vector的第一个元素开始，把vector中每个元素都置为0。
　　本节给出的例子程序和3.3.2节vector的下标操作的程序一样，如果vector为空，程序是安全的。如果ivec为空，则begin返回的迭代器不指向任何元素，由于没有元素，所以它不能指向任何元素——在这种情况下，从begin操作返回的迭代器与从end操作返回的迭代器的值相同，因此for语句中的测试条件立即失败。
　　6. const_iterator
　　前面的程序用vector::iterator改变vector中的元素值。每种容器类型还定义了一种名为const_iterator的类型，该类型只能访问容器内元素，但不能改变其值。
　　当我们对普通iterator类型解引用时，得到对某个元素的非const引用（2.5节）。而如果我们对const_iterator类型解引用时，则可以得到一个指向const对象的引用（2.4节），如同任何常量一样，该对象不能进行重写。
　　例如，如果text是vector<string>类型，程序员想要遍历它，输出每个元素,可以这样编写程序：
　　// use const_iterator because we won’t change the elements
　　for (vector<string>::const_iteratoriter = text.begin();
　　iter != text.end(); ++iter)
　　cout << *iter<< endl; // print each element intext
　　除了是从迭代器读取元素值而不是对它进行赋值之外，这个循环与前一个相似。由于这里只需要借助迭代器进行读，不需要写，这里把iter定义为const_iterator类型。当对const_iterator类型解引用时，返回的是一个const值。不允许用const_iterator进行赋值：
　　for (vector<string>::const_iteratoriter = text.begin();
　　iter != text.end(); ++ iter)
　　*iter = " "; // error: *iter is const
　　使用const_iterator类型时，我们可以得到一个迭代器，它自身的值可以改变，但不能用来改变其所指向的元素的值。可以对迭代器进行自增以及使用解引用操作符来读取值，但不能对该元素值赋值。
　　不要把const_iterator对象与const的iterator对象混淆起来。声明一个const迭代器时，必须初始化迭代器。一旦被初始化后，就不能改变它的值：
　　vector<int> nums(10); // nums isnonconst
　　const vector<int>::iterator cit =nums.begin();
　　*cit = 1; // ok: cit can change its underlying element
　　++cit; // error: can’t change the value of cit
　　const_iterator对象可以用于const vector或非constvector，因为不能改写元素值。const迭代器这种类型几乎没什么用处：一旦它被初始化后，只能用它来改写其指向的元素，但不能使它指向任何其他元素：
　　const vector<int> nines(10, 9); //cannot change elements in nines
　　// error: cit2 could change the element it refers to and nines isconst
　　const vector<int>::iterator cit2 =nines.begin();
　　// ok: it can’t change an element value, so it can be used with aconst vector<int>
　　vector<int>::const_iterator it =nines.begin();
　　*it = 10; // error: *it is const
　　++it; // ok: it isn’t const so we can change its value
　　// an iterator that cannot write elements
　　vector<int>::const_iterator
　　// an iterator whose value cannot change
　　const vector<int>::iterator
　　除了一次移动迭代器的一个元素的增量操作符外，vector的迭代器（很少有其他标准库容器迭代器）也支持其他的算术操作。这些操作称为迭代器算术操作（iteratorarithmetic），包括：
　　l iter + n
　　iter - n
　　可以对迭代器对象加上或减去一个整型值。这样做将产生一个新的迭代器，其位置在iter所指元素之前（加）或之后（减）n个元素的位置。加或减之后的结果必须指向iter所指vector中的某个元素，或者是vector末端的后一个元素。加上或减去的值的类型应该是vector的size_type或difference_type类型（参考下面的解释）。
　　l iter1 - iter2
　　该表达式用来计算两个迭代器对象的距离，该距离是名为difference_type的signed整数类型的值，这里的difference_type类型类似于size_type类型，也是由vector定义的。difference_type是signed类型，因为减法运算可能产生负数的结果。该类型可以保证足够大以存储任何两个迭代器对象间的距离。iter1与iter2两者必须都指向同一vector中的元素，或者指向vector末端之后的下一个元素。
　　可以用迭代器算术操作来移动迭代器直接指向某个元素，例如，下面语句直接定位于vector的中间元素：
　　vector<int>::iterator mid =vi.begin() + vi.size()/2;
　　上述代码用来初始化mid，使其指向vi中最靠近正中间的元素。这种直接计算迭代器的方法，与用迭代器逐个元素自增操作到达中间元素的方法是等价的，但前者的效率要高得多。
　　任何改变vector长度的操作都会使已存在的迭代器失效。例如，在调用push_back之后，就不能再信赖指向vector的迭代器的值了。
　　如果采用下面的方法来计算mid会产生什么结果？
　　vector<int>::iterator mid =(vi.begin() + vi.end())/2;

0 0