python学习（8）——高级特性

来源：互联网发布：淘宝实名认证账号出售编辑：程序博客网时间：2024/06/06 11:03

高级特性
- 切片关于list和tuple的操作
  - 注意
  - 例一
  - 例二
  - 例三
  - 例四
- 迭代
  - 判断一个东西是否能迭代
  - dict中的迭代
  - 多输出迭代
- 列表生成式
  - 格式
  - 范例
- 生成器generator
  - 练习
    - 解题经过
    - 答案
- 迭代器

高级特性

切片（关于list和tuple的操作）

可以将list和tuple甚至于字符串的选择性输出
标准格式
L[(这里填入选数的开始序号):(这里填入选数的结束序号): (这里填入每几个数选取一个数) ]
结束序号所在的数据不会被输出

注意

1.开始和介绍都是填的序号，而不是第几个
2.开始序号如果从0 开始可以省略，比如 L[:3]
3.支持倒数切片L[-2:] (可省略结尾，但结尾不是-1！)
这里写图片描述
4.切片输出的数据是不包括结束序号所在的数据的，所以L[-2:-1]只有一个数输出！！！
5.每几个数输出一个数可以连带前面的冒号省略，默认每个都取，注意是每几而不是每隔

例一

>>> L[0:3]   ['Michael', 'Sarah', 'Tracy']>>> L[:3]   ['Michael', 'Sarah', 'Tracy']>>> L[1:3]   ['Sarah', 'Tracy']>>> L[-2:]['Bob', 'Jack']>>> L[-2:-1]['Bob']

例二

切片操作十分有用。我们先创建一个0-99的数列：

>>> L = list(range(100))>>> L[0, 1, 2, 3, ..., 99]

可以通过切片轻松取出某一段数列。比如前10个数：

>>> L[:10][0, 1, 2, 3, 4, 5, 6, 7, 8, 9]后10个数：>>> L[-10:][90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

前11-20个数：

>>> L[10:20][10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

前10个数，每两个取一个：(不是隔2个取一个)

>>> L[:10:2][0, 2, 4, 6, 8]

所有数，每5个取一个：

>>> L[::5][0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]

甚至什么都不写，只写[:]就可以原样复制一个list：

>>> L[:][0, 1, 2, 3, ..., 99]

例三

tuple也是一种list，唯一区别是tuple不可变。因此，tuple也可以用切片操作，只是操作的结果仍是tuple：

>>> (0, 1, 2, 3, 4, 5)[:3](0, 1, 2)

例四

字符串’xxx’也可以看成是一种list，每个元素就是一个字符。因此，字符串也可以用切片操作，只是操作结果仍是字符串：

>>> 'ABCDEFG'[:3]'ABC'>>> 'ABCDEFG'[::2]'ACEG'

迭代

通过for循环来遍历整个list或tuple或其它，这种遍历我们称为迭代（Iteration）。

判断一个东西是否能迭代

通过collections模块的Iterable类型判断：

>>> from collections import Iterable>>> isinstance('abc', Iterable) # str是否可迭代True>>> isinstance([1,2,3], Iterable) # list是否可迭代True>>> isinstance(123, Iterable) # 整数是否可迭代False

dict中的迭代

>>> d = {'a': 1, 'b': 2, 'c': 3}>>> for key in d:...     print(key)...acb

因为dict的存储不是按照list的方式顺序排列，所以，迭代出的结果顺序很可能不一样。
默认情况下，dict迭代的是key。如果要迭代value，可以用for value in d.values()，如果要同时迭代key和value，可以用for k, v in d.items()

多输出迭代

Python内置的enumerate函数可以把一个list变成索引-元素对，这样就可以在for循环中同时迭代索引和元素本身：

>>> for i, value in enumerate(['A', 'B', 'C']):...     print(i, value)...0 A1 B2 C

同时引用了两个变量，在Python里是很常见的，比如下面的代码：

>>> for x, y in [(1, 1), (2, 4), (3, 9)]:...     print(x, y)...1 12 43 9

列表生成式

老厉害了

格式

[这里为表内容的计算格式 for xxx in xxx(范围) （可以多重循环）这里是表的内容的判断，符合条件的才会被添加到表内 ]

范例

列表生成式则可以用一行语句代替循环生成list：

>>> [x * x for x in range(1, 11)][1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

for循环后面还可以加上if判断，这样我们就可以筛选出仅偶数的平方：

>>> [x * x for x in range(1, 11) if x % 2 == 0][4, 16, 36, 64, 100]

还可以使用两层循环，可以生成全排列：

>>> [m + n for m in 'ABC' for n in 'XYZ']['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']

三层和三层以上的循环就很少用到了。
for循环其实可以同时使用两个甚至多个变量，比如dict的items()可以同时迭代key和value：

>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }>>> for k, v in d.items():...     print(k, '=', v)...y = Bx = Az = C

因此，列表生成式也可以使用两个变量来生成list：

>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }>>> [k + '=' + v for k, v in d.items()]['y=B', 'x=A', 'z=C']

这里+似乎是连接符，而不是加号

L3=[x + x for x in range(1, 11)][2, 4, 6, 8, 10, 12, 14, 16, 18, 20]

测试出来是加号
str和int一起用加号会报错，想了想也没问题。。。

生成器generator

通过列表生成式，我们可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？这样就不必创建完整的list，从而节省大量的空间。在Python中，这种一边循环一边计算的机制，称为生成器：generator。

要创建一个generator，有很多种方法。第一种方法很简单，只要把一个列表生成式的[]改成()，就创建了一个
generator保存的是算法，每次调用next(g)，就计算出g的下一个元素的值，直到计算到最后一个元素，没有更多的元素时，抛出StopIteration的错误。

当然，上面这种不断调用next(g)实在是太变态了，正确的方法是使用for循环，因为generator也是可迭代对象
所以，我们创建了一个generator后，基本上永远不会调用next()，而是通过for循环来迭代它，并且不需要关心StopIteration的错误。

generator非常强大。如果推算的算法比较复杂，用类似列表生成式的for循环无法实现的时候，还可以用函数来实现。

比如，著名的斐波拉契数列（Fibonacci），除第一个和第二个数外，任意一个数都可由前两个数相加得到：

1, 1, 2, 3, 5, 8, 13, 21, 34, …

斐波拉契数列用列表生成式写不出来，但是，用函数把它打印出来却很容易：

def fib(max):    n, a, b = 0, 0, 1    while n < max:        print(b)        a, b = b, a + b        n = n + 1    return 'done'

注意，赋值语句：

a, b = b, a + b
相当于：

t = (b, a + b) # t是一个tuple
a = t[0]
b = t[1]
但不必显式写出临时变量t就可以赋值。(看起来就是a=b,b=a+b 的简写？)
定义generator的另一种方法。如果一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator：

def fib(max):    n, a, b = 0, 0, 1    while n < max:        yield b        a, b = b, a + b        n = n + 1    return 'done'

generator和函数的执行流程不一样。函数是顺序执行，遇到return语句或者最后一行函数语句就返回。而变成generator的函数，在每次调用next()的时候执行，遇到yield语句返回，再次执行时从上次返回的yield语句处继续执行。

练习

杨辉三角定义如下：

          1        1   1      1   2   1    1   3   3   1  1   4   6   4   11   5   10  10  5   1

把每一行看做一个list，试写一个generator，不断输出下一行的list：

# -*- coding: utf-8 -*-???n = 0for t in triangles():    print(t)    n = n + 1    if n == 10:        break

解题经过

不得不承认构思了许久还是没有想出来。
逻辑都没有整理出来怎么写代码
最开始写的代码

def triangles():    L = [1]    while True:        yield L        L = [L[i - 1] + L[i] for i in range(len(L))]

while True最开始还忘加冒号了。输出根本不对，本来还担心如果没有怎么办，报错？哦，python里有L[-1]这种存在，结果变成一个单纯的翻倍函数了。才注意到这样子L根本不会变长啊，于是改成这样了:
L = [L[i - 1] + L[i] for i in range((len(L)+1))]
结果报出超出长度了，和c区别不少嘛(虽然c也不能这样延长吧，但至少不会报错的)。思考了以下，找了一下延长函数append，继续研究
其实当时挺接近结果了，结果我换了个方式写

def triangles():    L= [1]    while True:        yield ret        for i in range(1, len(L)):            L[i] = L[i] + L[i - 1]        L.append(1)

为了让第一个数不便还特意让它从1开始的，结果就只能对3行
经过多次验证，终于发现它是实时更新的L[i] = L[i] + L[i - 1]，L[i-1]已经是最新的了，那就建一个序列来保存之前的。

def triangles():    L= [1]    while True:        yield L        L1 = L        for i in range(1,len(L)):            L[i] = L1[i] + L1[i - 1]        L.append(1)

结果L1和L是一个序列啊，L更新它也跟着更新啊，你们两指针是不是指一起去了啊。
又研究一下怎么复制表，终于完成

def triangles():    L= [1]    while True:        yield L        L1 = L.copy()        for i in range(1,len(L)):            L[i] = L1[i] + L1[i - 1]        L.append(1)

答案

#方法一def triangles():    L = [1]    while True:        yield L        L.append(0)        L = [L[i - 1] + L[i] for i in range(len(L))]#方法二def triangles():    ret = [1]    while True:        yield ret        for i in range(1, len(ret)):            ret[i] = pre[i] + pre[i - 1]        ret.append(1)        pre = ret[:]

我的方法可以说就是第二种（原来这样就能复制List了啊）。看了看第一种， L = [L[i - 1] + L[i] for i in range(len(L))]，难道L[i]就不受L[i-1]的影响了吗？对的，不受。为什么倒是不清楚。。。。莫非不是逐项取代，而是生成新表删除旧表喽。原来还有最后补个0 这种操作的。
还差的远了

迭代器

我们已经知道，可以直接作用于for循环的数据类型有以下几种：

一类是集合数据类型，如list、tuple、dict、set、str等；

一类是generator，包括生成器和带yield的generator function。

这些可以直接作用于for循环的对象统称为可迭代对象：Iterable。

可以使用isinstance()判断一个对象是否是Iterable对象：
isinstance({}, Iterable)
而生成器不但可以作用于for循环，还可以被next()函数不断调用并返回下一个值，直到最后抛出StopIteration错误表示无法继续返回下一个值了。
可以被next()函数调用并不断返回下一个值的对象称为迭代器：Iterator
可以使用isinstance()判断一个对象是否是Iterator对象
isinstance([], Iterator)
生成器都是Iterator对象，但list、dict、str虽然是Iterable，却不是Iterator。
Iterator，也就是一个惰性序列，所以要强迫filter()完成计算结果，需要用list()函数获得所有结果并返回list。不然它会等到你要结果的时候才算
把list、dict、str等Iterable变成Iterator可以使用iter()函数

isinstance(iter('abc'), Iterator)True

凡是可作用于for循环的对象都是Iterable类型；

凡是可作用于next()函数的对象都是Iterator类型，它们表示一个惰性计算的序列；

集合数据类型如list、dict、str等是Iterable但不是Iterator，不过可以通过iter()函数获得一个Iterator对象。

Python的for循环本质上就是通过不断调用next()函数实现的

阅读全文

0 0