python学习(8)——高级特性

来源:互联网 发布:淘宝实名认证账号出售 编辑:程序博客网 时间:2024/06/06 11:03

  • 高级特性
    • 切片关于list和tuple的操作
      • 注意
      • 例一
      • 例二
      • 例三
      • 例四
    • 迭代
      • 判断一个东西是否能迭代
      • dict中的迭代
      • 多输出迭代
    • 列表生成式
      • 格式
      • 范例
    • 生成器generator
      • 练习
        • 解题经过
        • 答案
    • 迭代器

高级特性

切片(关于list和tuple的操作)

可以将list和tuple甚至于字符串的选择性输出
标准格式
L[(这里填入选数的开始序号):(这里填入选数的结束序号): (这里填入每几个数选取一个数) ]
结束序号所在的数据不会被输出

注意

1.开始和介绍都是填的序号,而不是第几个
2.开始序号如果从0 开始可以省略,比如 L[:3]
3.支持倒数切片L[-2:] (可省略结尾,但结尾不是-1!)
这里写图片描述
4.切片输出的数据是不包括结束序号所在的数据的,所以L[-2:-1]只有一个数输出!!!
5.每几个数输出一个数可以连带前面的冒号省略,默认每个都取,注意是每几而不是每隔

例一

>>> L[0:3]   ['Michael', 'Sarah', 'Tracy']>>> L[:3]   ['Michael', 'Sarah', 'Tracy']>>> L[1:3]   ['Sarah', 'Tracy']>>> L[-2:]['Bob', 'Jack']>>> L[-2:-1]['Bob']

例二

切片操作十分有用。我们先创建一个0-99的数列:

>>> L = list(range(100))>>> L[0, 1, 2, 3, ..., 99]

可以通过切片轻松取出某一段数列。比如前10个数:

>>> L[:10][0, 1, 2, 3, 4, 5, 6, 7, 8, 9]后10个数:>>> L[-10:][90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

前11-20个数:

>>> L[10:20][10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

前10个数,每两个取一个:(不是隔2个取一个)

>>> L[:10:2][0, 2, 4, 6, 8]

所有数,每5个取一个:

>>> L[::5][0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]

甚至什么都不写,只写[:]就可以原样复制一个list:

>>> L[:][0, 1, 2, 3, ..., 99]

例三

tuple也是一种list,唯一区别是tuple不可变。因此,tuple也可以用切片操作,只是操作的结果仍是tuple:

>>> (0, 1, 2, 3, 4, 5)[:3](0, 1, 2)

例四

字符串’xxx’也可以看成是一种list,每个元素就是一个字符。因此,字符串也可以用切片操作,只是操作结果仍是字符串:

>>> 'ABCDEFG'[:3]'ABC'>>> 'ABCDEFG'[::2]'ACEG'

迭代

通过for循环来遍历整个list或tuple或其它,这种遍历我们称为迭代(Iteration)。

判断一个东西是否能迭代

通过collections模块的Iterable类型判断:

>>> from collections import Iterable>>> isinstance('abc', Iterable) # str是否可迭代True>>> isinstance([1,2,3], Iterable) # list是否可迭代True>>> isinstance(123, Iterable) # 整数是否可迭代False

dict中的迭代

>>> d = {'a': 1, 'b': 2, 'c': 3}>>> for key in d:...     print(key)...acb

因为dict的存储不是按照list的方式顺序排列,所以,迭代出的结果顺序很可能不一样
默认情况下,dict迭代的是key。如果要迭代value,可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()

多输出迭代

Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身:

>>> for i, value in enumerate(['A', 'B', 'C']):...     print(i, value)...0 A1 B2 C

同时引用了两个变量,在Python里是很常见的,比如下面的代码:

>>> for x, y in [(1, 1), (2, 4), (3, 9)]:...     print(x, y)...1 12 43 9

列表生成式

老厉害了

格式

[这里为表内容的计算格式 for xxx in xxx(范围) (可以多重循环)这里是表的内容的判断,符合条件的才会被添加到表内 ]

范例

列表生成式则可以用一行语句代替循环生成list:

>>> [x * x for x in range(1, 11)][1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

for循环后面还可以加上if判断,这样我们就可以筛选出仅偶数的平方:

>>> [x * x for x in range(1, 11) if x % 2 == 0][4, 16, 36, 64, 100]

还可以使用两层循环,可以生成全排列:

>>> [m + n for m in 'ABC' for n in 'XYZ']['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']

三层和三层以上的循环就很少用到了。
for循环其实可以同时使用两个甚至多个变量,比如dict的items()可以同时迭代key和value:

>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }>>> for k, v in d.items():...     print(k, '=', v)...y = Bx = Az = C

因此,列表生成式也可以使用两个变量来生成list:

>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }>>> [k + '=' + v for k, v in d.items()]['y=B', 'x=A', 'z=C']

这里+似乎是连接符,而不是加号

L3=[x + x for x in range(1, 11)][2, 4, 6, 8, 10, 12, 14, 16, 18, 20]

测试出来是加号
str和int一起用加号会报错,想了想也没问题。。。

生成器generator

通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。

要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个
generator保存的是算法,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。

当然,上面这种不断调用next(g)实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象
所以,我们创建了一个generator后,基本上永远不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。

generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。

比如,著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:

1, 1, 2, 3, 5, 8, 13, 21, 34, …

斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:

def fib(max):    n, a, b = 0, 0, 1    while n < max:        print(b)        a, b = b, a + b        n = n + 1    return 'done'

注意,赋值语句:

a, b = b, a + b
相当于:

t = (b, a + b) # t是一个tuple
a = t[0]
b = t[1]
但不必显式写出临时变量t就可以赋值。(看起来就是a=b,b=a+b 的简写?)
定义generator的另一种方法。如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator:

def fib(max):    n, a, b = 0, 0, 1    while n < max:        yield b        a, b = b, a + b        n = n + 1    return 'done'

generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。

练习

杨辉三角定义如下:

          1        1   1      1   2   1    1   3   3   1  1   4   6   4   11   5   10  10  5   1

把每一行看做一个list,试写一个generator,不断输出下一行的list:

# -*- coding: utf-8 -*-???n = 0for t in triangles():    print(t)    n = n + 1    if n == 10:        break

解题经过

不得不承认构思了许久还是没有想出来。
逻辑都没有整理出来怎么写代码
最开始写的代码

def triangles():    L = [1]    while True:        yield L        L = [L[i - 1] + L[i] for i in range(len(L))]

while True最开始还忘加冒号了。输出根本不对,本来还担心如果没有怎么办,报错?哦,python里有L[-1]这种存在,结果变成一个单纯的翻倍函数了。才注意到这样子L根本不会变长啊,于是改成这样了:
L = [L[i - 1] + L[i] for i in range((len(L)+1))]
结果报出超出长度了,和c区别不少嘛(虽然c也不能这样延长吧,但至少不会报错的)。思考了以下,找了一下延长函数append,继续研究
其实当时挺接近结果了,结果我换了个方式写

def triangles():    L= [1]    while True:        yield ret        for i in range(1, len(L)):            L[i] = L[i] + L[i - 1]        L.append(1)

为了让第一个数不便还特意让它从1开始的,结果就只能对3行
经过多次验证,终于发现它是实时更新的L[i] = L[i] + L[i - 1],L[i-1]已经是最新的了,那就建一个序列来保存之前的。

def triangles():    L= [1]    while True:        yield L        L1 = L        for i in range(1,len(L)):            L[i] = L1[i] + L1[i - 1]        L.append(1)

结果L1和L是一个序列啊,L更新它也跟着更新啊,你们两指针是不是指一起去了啊。
又研究一下怎么复制表,终于完成

def triangles():    L= [1]    while True:        yield L        L1 = L.copy()        for i in range(1,len(L)):            L[i] = L1[i] + L1[i - 1]        L.append(1)

答案

#方法一def triangles():    L = [1]    while True:        yield L        L.append(0)        L = [L[i - 1] + L[i] for i in range(len(L))]#方法二def triangles():    ret = [1]    while True:        yield ret        for i in range(1, len(ret)):            ret[i] = pre[i] + pre[i - 1]        ret.append(1)        pre = ret[:]

我的方法可以说就是第二种(原来这样就能复制List了啊)。看了看第一种, L = [L[i - 1] + L[i] for i in range(len(L))],难道L[i]就不受L[i-1]的影响了吗?对的,不受。为什么倒是不清楚。。。。莫非不是逐项取代,而是生成新表删除旧表喽。原来还有最后补个0 这种操作的。
还差的远了

迭代器

我们已经知道,可以直接作用于for循环的数据类型有以下几种:

一类是集合数据类型,如list、tuple、dict、set、str等;

一类是generator,包括生成器和带yield的generator function。

这些可以直接作用于for循环的对象统称为可迭代对象:Iterable

可以使用isinstance()判断一个对象是否是Iterable对象:
isinstance({}, Iterable)
而生成器不但可以作用于for循环,还可以被next()函数不断调用并返回下一个值,直到最后抛出StopIteration错误表示无法继续返回下一个值了。
可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator
可以使用isinstance()判断一个对象是否是Iterator对象
isinstance([], Iterator)
生成器都是Iterator对象,但list、dict、str虽然是Iterable,却不是Iterator。
Iterator,也就是一个惰性序列,所以要强迫filter()完成计算结果,需要用list()函数获得所有结果并返回list。不然它会等到你要结果的时候才算
把list、dict、str等Iterable变成Iterator可以使用iter()函数

isinstance(iter('abc'), Iterator)True

凡是可作用于for循环的对象都是Iterable类型;

凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;

集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。

Python的for循环本质上就是通过不断调用next()函数实现的