【Python】使用生成器改写直接返回列表的函数

来源:互联网 发布:网络pc赌博怎么能赢 编辑:程序博客网 时间:2024/04/29 06:39

本文是《Effect Python 编写高质量Python代码的59个有效方法》的学习笔记。主要记录生成器的使用方法和示例代码。

返回队列的函数

如果函数要产生一系列结果,那么最简单的做法就是把这些结构都放在一份列表里,然后将其返回给调用者。

def index_words(text):    """用append方法将这些此的首字母索引添加到result列表中,并在函数结束时将其返回给调用者。"""    result = []    if text:        result.append(0)    for index, letter in enumerate(text):        if letter == ' ':            result.append(index+1)    return result

输入一些测试值,验证该函数能正常运行:

>address = 'Four score and seven years ago...'result = index_words(address)print(result[:3])

打印

[0, 5, 11]

生成器函数

这个函数改用生成器(generator)来写会更好。生成器是使用yield表达式的函数。调用生成器函数时,它并不会真的运行,而是会返回迭代器。每次在这个迭代器上面调用内置的next函数时,迭代器会把生成器推进到下一个yield表达式那里。生成器传给yield的每一个值,都会由迭代器返回给调用者。

def index_words_iter(text):    if text:        yield 0    for index, letter in enumerate(text):        if letter == ' ':            yield index + 1
result = list(index_words_iter(address))

注意:生成器函数返回的迭代器是有状态的,调用者不应该反复使用。

由于迭代器只能产生一轮结果。在抛出过StopIteration异常的迭代器或生成器上面继续迭代第二轮,是不会有结果的。为解决此问题,我们可以明确地使用该迭代器制作一份列表,将它的全部内容都遍历一次,并赋值到这份列表里,然后就可以在复制出来的数据列表上面多次迭代了。

为类实现生成器

下面是一个可以迭代的容器类,用来从文件中读取每行数据。

class ReadFileLines(object):    """    可以迭代的容器类,从文件中获取数据    """    def __init__(self, path):        self.path = path    def __iter__(self):        with open(self.path) as f:            for line in f:                yield line

多次迭代

如果想多次迭代生成器的数据,可以使用下面的函数。该函数会逐步拷贝生成器的所有数据,然后返回一个队列数据。

def normalize_defensive(datas):    """    从生成器返回一份可以多次迭代的数据    :param datas:容器     :return: result:队列(list)    """    # 确保调用者传进来的参数,并不是迭代器对象本身    if iter(datas) is iter(datas):        raise TypeError('Must supply a container')    # TODO    result = []    for data in datas:        # TODO        result.append(data)    return result
0 0
原创粉丝点击