python中的列表解析和列表生成表达式

来源：互联网发布：苹果cms有自带采集插件编辑：程序博客网时间：2024/06/11 16:35

Get Starting

优雅、清晰和务实都是python的核心价值观，如果想通过操作和处理一个序列（或其他的可迭代对象）来创建一个新的列表时，可以使用列表解析（ List comprehensions）和列表生成表达式，通过这两个操作，我们可以看到这三个观点是如何在python中和谐统一起来的。

列表解析表达式

在需要改变（从一个列表中创建）列表而不是新建某列表时，可以使用列表解析。列表解析表达式为：

[expr for iter_var in iterable] [expr for iter_var in iterable if cond_expr]

第一种语法：首先迭代iterable里所有内容，每一次迭代，都把iterable里相应内容放到iter_var中，再在表达式中应用该iter_var的内容，最后用表达式的计算值生成一个列表。
第二种语法：加入了判断语句，只有满足条件的内容才把iterable里相应内容放到iter_var中，再在表达式中应用该iter_var的内容，最后用表达式的计算值生成一个列表。

>>> L= [(x+1,y+1) for x in range(3) for y in range(5)] >>> L[(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5)]

>>> N=[x+10for x in range(10) if x>5]>>> N[16, 17, 18, 19]

newlist=[x+5for x in olderlist if x>10]

一个更复杂的列子：

>>> num = [j for i in range(2, 8) for j in range(i*2, 50, i)]>>> num[4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 10, 15, 20, 25, 30, 35, 40, 45, 12, 18, 24, 30, 36, 42, 48, 14, 21, 28, 35, 42, 49]

可以看到运作的方式就是：两个for循环不断的迭代，每次生成的值都放到expr中生成一个新的值，然后把每次产生的新值组合成一个列表。

>>> words ='The quick brown fox jumps over the lazy dog'.split()>>> words['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']>>> stuff = [[w.upper(), w.lower(), len(w)] for w in words]>>>for i in stuff:print i['THE', 'the', 3]['QUICK', 'quick', 5]['BROWN', 'brown', 5]['FOX', 'fox', 3]['JUMPS', 'jumps', 5]['OVER', 'over', 4]['THE', 'the', 3]['LAZY', 'lazy', 4]['DOG', 'dog', 3]

上述代码的map（）实现：

>>> stuff = map(lambda w: [w.upper(), w.lower(), len(w)], words)>>>for i in stuff:... print i... ['THE', 'the', 3]['QUICK', 'quick', 5]['BROWN', 'brown', 5]['FOX', 'fox', 3]['JUMPS', 'jumps', 5]['OVER', 'over', 4]['THE', 'the', 3]['LAZY', 'lazy', 4]['DOG', 'dog', 3]

列表生成器表达式

生成器表达式是在python2.4中引入的，当序列过长，而每次只需要获取一个元素时，应当考虑使用生成器表达式而不是列表解析。生成器表达式的语法和列表解析一样，只不过生成器表达式是被（）括起来的，而不是[]，如下：

(expr for iter_var in iterable) (expr for iter_var in iterable if cond_expr)

例如：

>>> L= (i +1for i in range(10) if i %2)>>> L<generator object <genexpr> at 0xb749a52c>>>> L1=[]>>>for i in L:... L1.append(i)... >>> L1[2, 4, 6, 8, 10]

生成器表达式并不真正创建数字列表，而是返回一个生成器，这个生成器在每次计算出一个条目后，把这个条目“产生”(yield)出来。生成器表达式使用了“惰性计算”(lazy evaluation，也有翻译为“延迟求值”，我以为这种按需调用call by need的方式翻译为惰性更好一些)，只有在检索时才被赋值（ evaluated），所以在列表比较长的情况下使用内存上更有效。

A generator object in python is something like a lazy list. The
elements are only evaluated as soon as you iterate over them.

一些说明

1.当需求只是执行一个循环操作的时候，尽量使用循环而不是列表解析，这样更符合python提倡的直观性

for item in sequence:process(item)

2.当有内建的操作或者类型能够以更直接的方式实现的，不要使用列表解析
例如复制一个列表时，使用：L1=list（L）即可，不必使用

L1=[x for x in L]

3.当序列过长，而每次只需要获取一个元素时，使用生成器表达式
4.列表解析的性能要比map要好，实现相同功能的for循环效率最差（和列表解析相比差两倍）
5.列表解析可以转换为 for循环或者使用map（其中可能会用到filter、lambda函数）表达式，但是列表解析更为简单明了，后者会带来更复杂和深层的嵌套

0 0