python自动化之路-day3.1

来源：互联网发布：汉以强亡知乎编辑：程序博客网时间：2024/05/29 17:59

1.迭代器和生成器

生成器

通过列表生成式，我们可以直接创建一个列表，但是受内存限制，列表容器肯定是有限的，而创建一个包含100万个元素的列表，

不仅占用了很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面的绝大元素占用的空间就白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推断算出后续元素呢？这样就不必创建完整的list，从而节省大量的空间，

在python中，这种一遍循环一遍计算的机制，称为生成器：generator

在python3.0中range函数是一个迭代器。

>>> L = [x*x for x in range(10)]
>>> L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> g = (x*x for x in range(10))
>>> g
<generator object <genexpr> at 0x024693A0>
>>>

创建L和g的区别仅仅在于最外层的 [] 和 () ，L是一个list，而g是一个generator.

我们可以直接打印出list的每个元素，但我们怎么打印出generator的每一个元素呢？如果一个个打印出来，可以通过next()函数获得generator的下一个返回值：

>>> g = (x*x for x in range(10))
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
>>> next(g)
9
>>> next(g)
16
>>> next(g)
25
>>> next(g)
36
>>> next(g)
49
>>> next(g)
64
>>> next(g)
81
>>> next(g)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
generator保存的是算法，每次调用next(g)，就计算出g下一个元素的值，直到计算到最后一个元素，没有更多的元素时，抛出Stopiteration错误。

正确做法使用for循环，因为generator也是可迭代对象：

>>> g = (x * x for x in range(10))

>>> for n in g:

...     print(n)

所以，我们创建一个generator后，基本上永远不会调用next(),而是通过for循环来迭代，不需要关心Stopiteration错误

generator非常强大。如果推算的算法比较复杂，用类似列表生成式的for循环无法实现的时候，还可以用函数来实现。

斐波拉契数列推算规则：

#!/usr/bin/env python# _*_ coding:utf-8 _*_def fibr(max):    n,a,b=0,0,1    while n < max:        yield b        a,b = b,a+b        n += 1    return "done"f = fibr(10)print(f)print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())

如果函数定义中含有yield关键字，那么它不是一个普通的函数，而是一个生成器generator。每次调用next（）时执行，

遇到yield语句返回，再执行时从上次的yield语句处继续执行。同样我们基本从来不用next（）来获取下一个返回值，

而是直接使用for循环来迭代。

for n in f:    print(n)

但是用for循环调用generator时，发现拿不到generator的return语句的返回值。如果想要拿到返回值，必须捕获StopIteration错误，返回值包含在StopIteration的value中：

while True:    try:        x = next(f)        print(x)    except StopIteration as e:        print("Generator return value:",e.value)        break

迭代器

我们已经知道，可以作用在for循环的数据类型有以下几种：

一类是集合数据类型：list，dict，tuple，set，str

一类是generator，包括生成器和带yield的generator function

这些直接作用于for循环的对象统称为可迭代对象：Iterable。可以使用isinstance()判断一个对象是否是Iterable对象

from collections import Iterableisinstance([],Iterable)isinstance({},Iterable)print(isinstance("abc",Iterable))

*可以被next()函数调用并不断返回下一个值的对象称为迭代器：Iterator。

生成器都是Iterator对象，但list、dict、str虽然是Iterable，却不是Iterator。

你可能会问，为什么list、dict、str等数据类型不是Iterator？

这是因为Python的Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，只能不断通过next()函数实现按需计算下一个数据，所以Iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算。

Iterator甚至可以表示一个无限大的数据流，例如全体自然数。而使用list是永远不可能存储全体自然数的。

it = iter([1,2,3,4,5,6])while True:    try:        x = next(it)        print(x)    except StopIteration:        break

异常处理

捕捉异常可以使用try/except语句。

try/except语句用来检测try语句块中的错误，从而让except语句捕获异常信息并处理。

如果你不想在异常发生时结束你的程序，只需在try里捕获它。

语法：

以下为简单的try....except...else的语法：

try:<语句>        #运行别的代码except <名字>：<语句>        #如果在try部份引发了'name'异常except <名字>，<数据>:<语句>        #如果引发了'name'异常，获得附加的数据else:<语句>        #如果没有异常发生

try的工作原理是，当开始一个try语句后，python就在当前程序的上下文中作标记，这样当异常出现时就可以回到这里，try子句先执行，接下来会发生什么依赖于执行时是否出现异常。

如果当try后的语句执行时发生异常，python就跳回到try并执行第一个匹配该异常的except子句，异常处理完毕，控制流就通过整个try语句（除非在处理异常时又引发新的异常）。
如果在try后的语句里发生了异常，却没有匹配的except子句，异常将被递交到上层的try，或者到程序的最上层（这样将结束程序，并打印缺省的出错信息）。
如果在try子句执行时没有发生异常，python将执行else语句后的语句（如果有else的话），然后控制流通过整个try语句。

未完待续。。。。

0 0