python中yield的用法

来源:互联网 发布:rsyslog linux 编辑:程序博客网 时间:2024/05/31 19:39

写爬虫时,因为一个网页中要写多个字典,但是没有储存的必要,直接打印就完了,这个时候写yield就要方便的多,然后去查了资料,看了半小时才看懂…….把原文转一下,有些地方加一点注释。
http://www.jianshu.com/p/d09778f4e055
http://www.cnblogs.com/coderzh/archive/2008/05/18/1202040.html
原文链接。
1. 通常的for…in…循环中,in后面是一个数组,这个数组就是一个可迭代对象,类似的还有链表,字符串,文件。它可以是mylist = [1, 2, 3],也可以是mylist = [x*x for x in range(3)]。
它的缺陷是所有数据都在内存中,如果有海量数据的话将会非常耗内存。
2. 生成器是可以迭代的,但只可以读取它一次。因为用的时候才生成。比如 mygenerator = (x*x for x in range(3)),注意这里用到了(),它就不是数组,而上面的例子是[]。
3. 我理解的生成器(generator)能够迭代的关键是它有一个next()方法,工作原理就是通过重复调用next()方法,直到捕获一个异常。可以用上面的mygenerator测试。
4. 带有 yield 的函数不再是一个普通函数,而是一个生成器generator,可用于迭代,工作原理同上。
5. yield 是一个类似 return 的关键字,迭代一次遇到yield时就返回yield后面(右边)的值。重点是:下一次迭代时,从上一次迭代遇到的yield后面的代码(下一行)开始执行。
6. 简要理解:yield就是 return 返回一个值,对该值进行一些操作,并且记住这个返回的位置,下次迭代就从这个位置后(下一行)开始。
7. send(msg)与next()的区别在于send可以传递参数给yield表达式,这时传递的参数会作为yield表达式的值,而yield的参数是返回给调用者的值。——换句话说,就是send可以强行修改上一个yield表达式值。比如函数中有一个yield赋值,a = yield 5,第一次迭代到这里会返回5,a还没有赋值。第二次迭代时,使用.send(10),那么,就是强行修改yield 5表达式的值为10,本来是5的,那么a=10
8. 第一次调用时必须先next()或send(None),否则会报错,send后之所以为None是因为这时候没有上一个yield(根据第8条)。可以认为,next()等同于send(None)。
看代码

#encoding:UTF-8  def yield_test(n):      for i in range(n):          yield call(i)          print("i=",i)      #做一些其它的事情          print("do something.")          print("end.")  def call(i):      return i*2  #使用for循环  for i in yield_test(5):      print(i,",")

结果是:

>>>   0 ,  i= 0  2 ,  i= 1  4 ,  i= 2  6 ,  i= 3  8 ,  i= 4  do something.  end.  >>> 

例如第一次时,i=0,进入yield_test函数的第一个循环后,遇到yield call(i),则return一个0,到print(i,”,”)中去输出,然后再从yield call(i)后一行继续进行,依次这样进行,得到输出结果。

原创粉丝点击