Python 列表解析

来源:互联网 发布:凯文史派西出柜 知乎 编辑:程序博客网 时间:2024/06/06 02:57

转载:http://www.jianshu.com/p/c635d3c798c2

list是python中十分重要的一种数据结构,生成新的list是python程序员每天都会进行的工作,除了机械的使用for循环,append函数等方式来生成列表,还可以考虑使用更加pythonic的方式来的到列表

一、什么是列表解析?

简单来说,列表解析(list comprehension)提供了一种优雅的生成列表的方法,能用一行代码代替十几行代码,而且不损失任何可读性。而且,性能还快很多很多

简单给个例子,如果我们需要0~100所有偶数组成的列表,正常的代码应该是这样的:

a=[]for i in range(101):    if i%2==0:        a.append(i)

用列表解析来做就是这样的:

a=[x for x in range(101) if x%2==0]

简单的一行代码代替了4行代码

从上面的例子来看列表解析的语法其实不难,可以分成三个部分来看

  • x:我们需要的列表里面的结果(1st part)
  • for x in range(101):x来源——0~100的数字(2nd part)
  • if x%2==0:x成立的条件,如果不成立就不放在列表里了(3rd part)

例2,获取文本中所有单词的第1个字符

正常的代码

text="My house is full of flowers"first_charts=[]for word in text.split():    first_charts.append(word[0])

列表解析的代码:

first_charts=[word[0] for word in text.split()]

从上面的这个例子可以看出,列表解析的第一部分也可以是任意一个表达式

例3,获取两个列表对应位的乘积

来个复杂的,list a=[2,3,4,5]; list b=[3,4,5,6],想要得到a,b对应位的乘积:

[i*j for i,j in zip(a,b)]

除了列表解析,还需要使用zip函数来帮忙,zip将a,b对应位打包起来,返回[[2,3][3,4][4,5][5,6]]

例4,带if else的列表解析

list a=['1','2','3','i','8'],现在想将a中所有能转化为数字的字符串转化为数字,不为数字的内容都转换成0,用列表解析可以这样写:

[int(i) if i.isdigit() else 0 for i in a]out>>[1,2,3,0,8]

增加一点难度,如果list a=['1','2','3',4,5,'o','6'],如果不能转换成数字则为None,列表解析可以这样写:

[int(i) if str(i).isdigit() else None for i in a]out>>[1, 2, 3, 4, 5, None, 6]

从这个例子我们可以看到,在第一个部分,可以嵌套若干if else的语句在表达式里面。

例5,获取一个全0列表

有时候我们可能需要获取一个长度指定,全零或者全为某个值列表:

['ok' for i in range(10)]

得到一个长度为10的,全'ok'字符组成的列表

例6,略复杂的列表解析,获取列表中嵌套列表的元素,生成一个无嵌套的新列表

这个例子说起来挺拗口,实际上是想从[[1,2],[3,4,5],[6,7],[8]]这种列表中,把嵌套在列表中的元素解出来,得到[1,2,3,4,5,6,7,8],用列表解析可以这样写:

a=[[1,2],[3,4,5],[6,7],[8]][x  for i in a for x in i] out>>[1,2,3,4,5,6,7,8]

理解起来略有一点麻烦,for i in a,i为子列表,for x in i,x得到每个子列表中的值。这样的列表解析写法确实很难理解,所以有时候我们不要过分的使用复杂的列表解析。

例7,获取笛卡尔积

假设有三个配置列表

>>> a=['4k','8k','12k']>>> b=['1','2,','3']                                                                                                                             >>> c=['libaio','bio','directio']

我们想获取其笛卡尔积,列表解析的写法,得到:

[{'blocksize':x,'numjobs':y,'ioengine':z} for x in a for y in b for z in c]

这样就得到一个包含所有参数项目的字典列表,避免了写若干个for循环

例8,获取所有可能的组合

假设有一个配置列表['a','b','c'],我们想获取所有的由a,b,c组成的字符串(可以重复使用,将顺序也考虑在内),列表解析需要配合itertools中的product函数:

from itertools import productx=['a','b','c']results = ["".join(i) for i in product(x, repeat=3)]out>>['aaa', 'aab', 'aac', 'aba', 'abb', 'abc', 'aca', 'acb', 'acc', 'baa', 'bab', 'bac', 'bba', 'bbb', 'bbc', 'bca', 'bcb', 'bc                                            c', 'caa', 'cab', 'cac', 'cba', 'cbb', 'cbc', 'cca', 'ccb', 'ccc']

例9,矩阵转置
考虑一个矩阵,matrix=[[1, 2, 3, 4], [2, 4, 6, 8], [3, 6, 9, 12]],现在要获得他的转置矩阵,用列表解析仍然是一行:

transposed = [list(row) for row in zip(*matrix)]

matrix使用zip解开(完成转置),列表解析负责将结果生成原来的列表嵌套列表的模式

这个case也可以不用列表解析:

transposed = list(map(list, zip(*matrix)))

使用map函数也是可以的(顺便提一下)

二、列表解析快多少?

相比于for循环,列表解析的语法是由底层c语言实现的,它和使用for循环遍历pyobject对象相比,性能会有很大的提升,具体可以对比一下,定义两个函数:

def l1_true(L):    a=[x*x for x in L]    returndef l1_false(L):    a=[]    for i in L:        a.append(i*i)    return

L为range(10000),将这两个函数循环执行10000次,计算平均耗时得到:

l1_true:0.0007sl1_false:0.0014s

从耗时来看,使用列表解析后生成同样列表,耗时是使用for循环的二分之一

使用例6的列表解析来对比

def l2_true(L):    result=[x  for i in L for x in i]    returndef l2_false(L):    a=[]    for i in L:        for x in i:            a.append(x)

L=[[i,i+1] for i in range(10000)],循环执行10000次对比结果为:

l2_true:0.0015l2_false:0.0033

由上面两个例子可以看出,列表解析的将会大大提高python代码的执行效率,在实际工作中感觉也同样明显,应该尽量多使用列表解析

list是python中十分重要的一种数据结构,生成新的list是python程序员每天都会进行的工作,除了机械的使用for循环,append函数等方式来生成列表,还可以考虑使用更加pythonic的方式来的到列表

一、什么是列表解析?

简单来说,列表解析(list comprehension)提供了一种优雅的生成列表的方法,能用一行代码代替十几行代码,而且不损失任何可读性。而且,性能还快很多很多

简单给个例子,如果我们需要0~100所有偶数组成的列表,正常的代码应该是这样的:

a=[]for i in range(101):    if i%2==0:        a.append(i)

用列表解析来做就是这样的:

a=[x for x in range(101) if x%2==0]

简单的一行代码代替了4行代码

从上面的例子来看列表解析的语法其实不难,可以分成三个部分来看

  • x:我们需要的列表里面的结果(1st part)
  • for x in range(101):x来源——0~100的数字(2nd part)
  • if x%2==0:x成立的条件,如果不成立就不放在列表里了(3rd part)

例2,获取文本中所有单词的第1个字符

正常的代码

text="My house is full of flowers"first_charts=[]for word in text.split():    first_charts.append(word[0])

列表解析的代码:

first_charts=[word[0] for word in text.split()]

从上面的这个例子可以看出,列表解析的第一部分也可以是任意一个表达式

例3,获取两个列表对应位的乘积

来个复杂的,list a=[2,3,4,5]; list b=[3,4,5,6],想要得到a,b对应位的乘积:

[i*j for i,j in zip(a,b)]

除了列表解析,还需要使用zip函数来帮忙,zip将a,b对应位打包起来,返回[[2,3][3,4][4,5][5,6]]

例4,带if else的列表解析

list a=['1','2','3','i','8'],现在想将a中所有能转化为数字的字符串转化为数字,不为数字的内容都转换成0,用列表解析可以这样写:

[int(i) if i.isdigit() else 0 for i in a]out>>[1,2,3,0,8]

增加一点难度,如果list a=['1','2','3',4,5,'o','6'],如果不能转换成数字则为None,列表解析可以这样写:

[int(i) if str(i).isdigit() else None for i in a]out>>[1, 2, 3, 4, 5, None, 6]

从这个例子我们可以看到,在第一个部分,可以嵌套若干if else的语句在表达式里面。

例5,获取一个全0列表

有时候我们可能需要获取一个长度指定,全零或者全为某个值列表:

['ok' for i in range(10)]

得到一个长度为10的,全'ok'字符组成的列表

例6,略复杂的列表解析,获取列表中嵌套列表的元素,生成一个无嵌套的新列表

这个例子说起来挺拗口,实际上是想从[[1,2],[3,4,5],[6,7],[8]]这种列表中,把嵌套在列表中的元素解出来,得到[1,2,3,4,5,6,7,8],用列表解析可以这样写:

a=[[1,2],[3,4,5],[6,7],[8]][x  for i in a for x in i] out>>[1,2,3,4,5,6,7,8]

理解起来略有一点麻烦,for i in a,i为子列表,for x in i,x得到每个子列表中的值。这样的列表解析写法确实很难理解,所以有时候我们不要过分的使用复杂的列表解析。

例7,获取笛卡尔积

假设有三个配置列表

>>> a=['4k','8k','12k']>>> b=['1','2,','3']                                                                                                                             >>> c=['libaio','bio','directio']

我们想获取其笛卡尔积,列表解析的写法,得到:

[{'blocksize':x,'numjobs':y,'ioengine':z} for x in a for y in b for z in c]

这样就得到一个包含所有参数项目的字典列表,避免了写若干个for循环

例8,获取所有可能的组合

假设有一个配置列表['a','b','c'],我们想获取所有的由a,b,c组成的字符串(可以重复使用,将顺序也考虑在内),列表解析需要配合itertools中的product函数:

from itertools import productx=['a','b','c']results = ["".join(i) for i in product(x, repeat=3)]out>>['aaa', 'aab', 'aac', 'aba', 'abb', 'abc', 'aca', 'acb', 'acc', 'baa', 'bab', 'bac', 'bba', 'bbb', 'bbc', 'bca', 'bcb', 'bc                                            c', 'caa', 'cab', 'cac', 'cba', 'cbb', 'cbc', 'cca', 'ccb', 'ccc']

例9,矩阵转置
考虑一个矩阵,matrix=[[1, 2, 3, 4], [2, 4, 6, 8], [3, 6, 9, 12]],现在要获得他的转置矩阵,用列表解析仍然是一行:

transposed = [list(row) for row in zip(*matrix)]

matrix使用zip解开(完成转置),列表解析负责将结果生成原来的列表嵌套列表的模式

这个case也可以不用列表解析:

transposed = list(map(list, zip(*matrix)))

使用map函数也是可以的(顺便提一下)

二、列表解析快多少?

相比于for循环,列表解析的语法是由底层c语言实现的,它和使用for循环遍历pyobject对象相比,性能会有很大的提升,具体可以对比一下,定义两个函数:

def l1_true(L):    a=[x*x for x in L]    returndef l1_false(L):    a=[]    for i in L:        a.append(i*i)    return

L为range(10000),将这两个函数循环执行10000次,计算平均耗时得到:

l1_true:0.0007sl1_false:0.0014s

从耗时来看,使用列表解析后生成同样列表,耗时是使用for循环的二分之一

使用例6的列表解析来对比

def l2_true(L):    result=[x  for i in L for x in i]    returndef l2_false(L):    a=[]    for i in L:        for x in i:            a.append(x)

L=[[i,i+1] for i in range(10000)],循环执行10000次对比结果为:

l2_true:0.0015l2_false:0.0033

由上面两个例子可以看出,列表解析的将会大大提高python代码的执行效率,在实际工作中感觉也同样明显,应该尽量多使用列表解析

原创粉丝点击