python自动化之路-day3.1

来源:互联网 发布:汉以强亡 知乎 编辑:程序博客网 时间:2024/05/29 17:59

1.迭代器和生成器

生成器

通过列表生成式,我们可以直接创建一个列表,但是受内存限制,列表容器肯定是有限的,而创建一个包含100万个元素的列表,

不仅占用了很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面的绝大元素占用的空间就白白浪费了。

所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推断算出后续元素呢?这样就不必创建完整的list,从而节省大量的空间,

在python中,这种一遍循环一遍计算的机制,称为生成器:generator

在python3.0中range函数是一个迭代器。

>>> L = [x*x for x in range(10)]
>>> L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> g = (x*x for x in range(10))
>>> g
<generator object <genexpr> at 0x024693A0>
>>>

创建L和g的区别仅仅在于最外层的 [] 和 () ,L是一个list,而g是一个generator.

我们可以直接打印出list的每个元素,但我们怎么打印出generator的每一个元素呢?如果一个个打印出来,可以通过next()函数获得generator的下一个返回值:


>>> g = (x*x for x in range(10))
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
>>> next(g)
9
>>> next(g)
16
>>> next(g)
25
>>> next(g)
36
>>> next(g)
49
>>> next(g)
64
>>> next(g)
81
>>> next(g)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration
generator保存的是算法,每次调用next(g),就计算出g下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出Stopiteration错误。

正确做法使用for循环,因为generator也是可迭代对象:

>>> g = (x * for in range(10))
>>> for in g:
...     print(n)
所以,我们创建一个generator后,基本上永远不会调用next(),而是通过for循环来迭代,不需要关心Stopiteration错误

generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。

斐波拉契数列推算规则:

#!/usr/bin/env python# _*_ coding:utf-8 _*_def fibr(max):    n,a,b=0,0,1    while n < max:        yield b        a,b = b,a+b        n += 1    return "done"f = fibr(10)print(f)print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())print(f.__next__())
如果函数定义中含有yield关键字,那么它不是一个普通的函数,而是一个生成器generator。每次调用next()时执行,

遇到yield语句返回,再执行时从上次的yield语句处继续执行。同样我们基本从来不用next()来获取下一个返回值,

而是直接使用for循环来迭代。

for n in f:    print(n)

但是用for循环调用generator时,发现拿不到generator的return语句的返回值。如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIterationvalue中:

while True:    try:        x = next(f)        print(x)    except StopIteration as e:        print("Generator return value:",e.value)        break

迭代器

我们已经知道,可以作用在for循环的数据类型有以下几种:

一类是集合数据类型:list,dict,tuple,set,str

一类是generator,包括生成器和带yield的generator function

这些直接作用于for循环的对象统称为可迭代对象:Iterable。可以使用isinstance()判断一个对象是否是Iterable对象

from collections import Iterableisinstance([],Iterable)isinstance({},Iterable)print(isinstance("abc",Iterable))
*可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator

生成器都是Iterator对象,但listdictstr虽然是Iterable,却不是Iterator

你可能会问,为什么listdictstr等数据类型不是Iterator

这是因为Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。

Iterator甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。

it = iter([1,2,3,4,5,6])while True:    try:        x = next(it)        print(x)    except StopIteration:        break

异常处理

捕捉异常可以使用try/except语句。

try/except语句用来检测try语句块中的错误,从而让except语句捕获异常信息并处理。

如果你不想在异常发生时结束你的程序,只需在try里捕获它。

语法:

以下为简单的try....except...else的语法:

try:<语句>        #运行别的代码except <名字>:<语句>        #如果在try部份引发了'name'异常except <名字>,<数据>:<语句>        #如果引发了'name'异常,获得附加的数据else:<语句>        #如果没有异常发生

try的工作原理是,当开始一个try语句后,python就在当前程序的上下文中作标记,这样当异常出现时就可以回到这里,try子句先执行,接下来会发生什么依赖于执行时是否出现异常。

  • 如果当try后的语句执行时发生异常,python就跳回到try并执行第一个匹配该异常的except子句,异常处理完毕,控制流就通过整个try语句(除非在处理异常时又引发新的异常)。
  • 如果在try后的语句里发生了异常,却没有匹配的except子句,异常将被递交到上层的try,或者到程序的最上层(这样将结束程序,并打印缺省的出错信息)。
  • 如果在try子句执行时没有发生异常,python将执行else语句后的语句(如果有else的话),然后控制流通过整个try语句。
未完待续。。。。
0 0