iterator/generator 应用举例 Mymap / Myzip

来源:互联网 发布:淘宝帐号登录 编辑:程序博客网 时间:2024/06/08 02:26

现在我们编写自己的map方法,并且比较他们之间的速度

def mymap(func, *seqs):    res =[]    for args in zip(*seqs):                     #用的是序列组的迭代器         res.append(func(*args))                 #这里面一定要是*args用于解引用,把    return resdef mymap(func, *seqs):    return[func(*args) for args in zip(*seqs)]  #返回列表解析,它实际上就是一次性求的结果列表
上面两种方式最后都会一次性构建结果列表,所以对文件太大的话,浪费内存。
下面的方式给我们的启示:现在在mymap中for循环,你如果不管它的话,它是对zip(*seqs)是迭代处理,注意它是不停顿的,一直处理到*seqs结束;但是现在如果你想让他省内存空间和加快速度的话,你应该是在读入一段以后,把它输出去,让外面调用它的式子先把它执行了,然后我们在接着mymap中对seqs的处理。所以说你就需要在mymap中加入一个yield语句了。让读入的东西,处理完;你再接着刚才的位置读入。
def mymap(func, *seqs):    res=[]    for args in zip(*seqs):        yield func(*args)def mymap(func, *seqs):    return(func(*args) for args in zip(*seqs))  #简单的yield操作,一般都可以转化成生成器表达式形式

问题一:为啥是zip(*seqs)和func(*args)?

刚开始我认为seqs的值是一个元组,然后我们在调用的时候,不应该是用这个形式吗?其实我当时主要是忘了考虑它实际上是在对元组进行解包。

因为譬如mymap(pow, (1,2,3),(4,5,6))最后seqs=((1,2,3),(4,5,6))即元组的元组,所以对于zip(seqs),它将是形式zip(((1,2,3),(4,5,6)))括号里仅一个元组,你还怎么跟人家组合?我们想期待的形式应该是zip((1,2,3),(4,5,6)),这个时候就要用到解包了。你需要对seqs解包成小单元。即:*seqs=> (1,2,3),(4,5,6)

然后仍旧按照这个例子进行解析:mymap(pow, (1,2,3),(4,5,6)) 而形参是形式 mymap(func, *seqs),所以seqs=((1,2,3),(4,5,6)),然后zip((1,2,3),(4,5,6)) ->args =(1,4) -> yield pow(*args) = yield pow(1,4)

def myzip(*seqs):seqs = [list(s) for s in seqs]        #for 实际上就是把大的单元划分成小块,然后再进行处理,其前一步也相当与一个解包res = []while all(seqs):res.append(tuple(s.pop(0) for s in seqs))return res

2:其实不知道你是否考虑过zip(*seqs),它究竟是在编译的时候求好结果,然后对这个结果进行一番迭代,还是for循环每执行一次,后面才给一个值呢?