python中使用迭代器 Iterator

来源:互联网 发布:淘宝手机浏览任务软件 编辑:程序博客网 时间:2024/05/14 02:20

迭代器是访问集合内元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素都被访问一遍后结束。

迭代器不能回退,只能往前进行迭代。这并不是什么很大的缺点,因为人们几乎不需要在迭代途中进行回退操作。

对于原生支持随机访问的数据结构(如tuplelist),迭代器和经典for循环的索引访问相比并无优势,反而丢失了索引值(可以使用内建函数enumerate()找回这个索引值,这是后话)。但对于无法随机访问的数据结构(比如set)而言,迭代器是唯一的访问元素的方式。
迭代器的另一个优点就是它不要求你事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代至某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件,或是斐波那契数列等等。这个特点被称为延迟计算或惰性求值(Lazy evaluation)。

迭代器更大的功劳是提供了一个统一的访问集合的接口。只要是实现了iter()方法的对象,就可以使用迭代器进行访问。

使用迭代器

使用内建的工厂函数iter(iterable)可以获取迭代器对象:

> lst = range(3)> it = iter(lst)> it<listiterator object at 0x0251BFD0>

使用迭代器的next()方法可以访问下一个元素:

it.next()
0
next(it)
1

两者的效果是一样的。

Python里的迭代器并没有提供类似has_next()这样的方法,如果迭代器访问到最后一个,再次使用next()函数会引发异常 StopIteration。我们可以通过捕获异常的方式结束。

>it = iter(lst)>try:    while True:        val = it.next()        print val>except StopIteration:    pass

因为迭代操作如此普遍,Python专门将关键字for用作了迭代器的语法。在for循环中,Python将自动调用工厂函数iter()获得迭代器,自动调用next()获取元素,还完成了检查StopIteration异常的工作。上述代码可以写成如下的形式:

for val in lst:    print val

首先Python将对关键字in后的对象调用iter函数获取迭代器,然后调用迭代器的next方法获取元素,直到抛出StopIteration异常。对迭代器调用iter函数时将返回迭代器自身,所以迭代器也可以用于for语句中,不需要特殊处理。
常用的几个内建数据结构tuple、list、set、dict都支持迭代器,字符串也可以使用迭代操作。你也可以自己实现一个迭代器,如上所述,只需要在类的iter方法中返回一个对象,这个对象拥有一个next()方法,这个方法能在恰当的时候抛出StopIteration异常即可。

0 0
原创粉丝点击