Python（四） Dict 和 Set

来源：互联网发布：java九大排序算法编辑：程序博客网时间：2024/05/16 05:14

字典(Dictionary)

经过之前的学习，我们可以知道 list 和 tuple 可以用来表示有序集合，之前我们那个例子是用 list 来存储了用户的昵称。

user=['liangdianshui','twowater','两点水']

如果我们需要把用户的账号也记录进去呢？
用 list 可以这样子解决：

user=[['liangdianshui','111111'],['twowater','222222'],['两点水','333333']]

可是这样表示也不方便，而且很难根据昵称找到对应的昵称，且 list 越长，耗时越长；这时候就可以用 dict （字典）来表示了，Python 内置了字典（dict），dict 全称dictionary，相当于 JAVA 中的 map，使用键-值（key-value）存储，具有极快的查找速度。

user={'liangdianshui':'111111' ,'twowater':'222222' ,'两点水':'333333'}

dict （字典）的创建

字典是另一种可变容器模型，且可存储任意类型对象。
字典的每个键值(key=>value)对用冒号(:)分割，每个对之间用逗号(,)分割，整个字典包括在花括号({})中 ,格式如下所示：

dict = {key1 : value1, key2 : value2 }

注意：键必须是唯一的，但值则不必。值可以取任何数据类型，但键必须是不可变的。
创建 dict（字典）实例：

dict1={'liangdianshui':'111111' ,'twowater':'222222' ,'两点水':'333333'}dict2={'abc':1234,1234:'abc'}

访问 dict （字典）

#encoding=utf-8dict1={'liangdianshui':'111111' ,'twowater':'222222' ,'两点水':'333333'}print(dict1)

输出的结果：

{'liangdianshui': '111111', 'twowater': '222222', '两点水': '333333'}

这里需要注意的一点是：如果字典中没有这个键，是会报错的。

修改 dict （字典）

向字典添加新内容的方法是增加新的键/值对，修改或删除已有键/值对

# encoding=utf-8dict1={'liangdianshui':'111111' ,'twowater':'222222' ,'两点水':'333333'}print(dict1)# 新增一个键值对dict1['jack']='444444'print(dict1)# 修改键值对dict1['liangdianshui']='555555'print(dict1)

输出的结果：

{'liangdianshui': '111111', 'twowater': '222222', '两点水': '333333'}{'liangdianshui': '111111', 'twowater': '222222', '两点水': '333333', 'jack': '444444'}{'liangdianshui': '555555', 'twowater': '222222', '两点水': '333333', 'jack': '444444'}

删除 dict （字典）

通过 del 可以删除 dict （字典）中的某个元素，也能删除 dict （字典）
通过调用clear()方法可以清除字典中的所有元素

# encoding=utf-8dict1={'liangdianshui':'111111' ,'twowater':'222222' ,'两点水':'333333'}print(dict1)# 通过 key 值，删除对应的元素del dict1['twowater']print(dict1)# 删除字典中的所有元素dict1.clear()print(dict1)# 删除字典del dict1

输出的结果：

{'liangdianshui': '111111', 'twowater': '222222', '两点水': '333333'}{'liangdianshui': '111111', '两点水': '333333'}{}

dict （字典）使用时注意的事项

(1) dict （字典）是不允许一个键创建两次的，但是在创建 dict （字典）的时候如果出现了一个键值赋予了两次，会以最后一次赋予的值为准

例如：

# encoding=utf-8dict1={'liangdianshui':'111111' ,'twowater':'222222' ,'两点水':'333333','twowater':'444444'}print(dict1)print(dict1['twowater'])

输出的结果：

{'liangdianshui': '111111', 'twowater': '444444', '两点水': '333333'}444444

(2) dict （字典）键必须不可变，可是键可以用数字，字符串或元组充当，但是就是不能使用列表

例如：

# encoding=utf-8dict1={'liangdianshui':'111111' ,123:'222222' ,(123,'tom'):'333333','twowater':'444444'}print(dict1)

输出结果：

{'liangdianshui': '111111', 123: '222222', (123, 'tom'): '333333', 'twowater': '444444'}

(3) dict 内部存放的顺序和 key 放入的顺序是没有任何关系

和 list 比较，dict 有以下几个特点：

查找和插入的速度极快，不会随着key的增加而变慢
需要占用大量的内存，内存浪费多

而list相反：

查找和插入的时间随着元素的增加而增加
占用空间小，浪费内存很少

dict （字典）的函数和方法

方法和函数描述 cmp(dict1, dict2) 比较两个字典元素 len(dict) 计算字典元素个数 str(dict) 输出字典可打印的字符串表示 type(variable) 返回输入的变量类型，如果变量是字典就返回字典类型 dict.clear() 删除字典内所有元素 dict.copy() 返回一个字典的浅复制 dict.values() 以列表返回字典中的所有值 popitem() 随机返回并删除字典中的一对键和值 dict.items() 以列表返回可遍历的(键, 值) 元组数组

set

python 的 set 和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素。set 和 dict 类似，但是 set 不存储 value 值的。

set 的创建

创建一个 set，需要提供一个 list 作为输入集合

set1=set([123,456,789])print(set1)

输出结果：

{456, 123, 789}

传入的参数 [123,456,789] 是一个 list，而显示的 {456, 123, 789} 只是告诉你这个 set 内部有 456, 123, 789 这 3 个元素，显示的顺序跟你参数中的 list 里的元素的顺序是不一致的，这也说明了 set 是无序的。

还有一点，我们观察到输出的结果是在大括号中的，经过之前的学习，可以知道，tuple (元组) 使用小括号，list (列表) 使用方括号, dict (字典) 使用的是大括号，dict 也是无序的，只不过 dict 保存的是 key-value 键值对值，而 set 可以理解为只保存 key 值。

回忆一下，在 dict （字典）中创建时，有重复的 key ，会被后面的 key-value 值覆盖的，而重复元素在 set 中自动被过滤的。

set1=set([123,456,789,123,123])print(set1)

输出的结果：

{456, 123, 789}

set 添加元素

通过 add(key) 方法可以添加元素到 set 中，可以重复添加，但不会有效果

set1=set([123,456,789])print(set1)set1.add(100)print(set1)set1.add(100)print(set1)

输出结果：

{456, 123, 789}{456, 123, 100, 789}{456, 123, 100, 789}

set 删除元素

通过 remove(key) 方法可以删除 set 中的元素

set1=set([123,456,789])print(set1)set1.remove(456)print(set1)

输出的结果：

{456, 123, 789}{123, 789}

set 的运用

因为 set 是一个无序不重复元素集，因此，两个 set 可以做数学意义上的 union(并集), intersection(交集), difference(差集) 等操作。

这里写图片描述

例子：

set1=set('hello')set2=set(['p','y','y','h','o','n'])print(set1)print(set2)# 交集 (求两个 set 集合中相同的元素)set3=set1 & set2print('\n交集 set3:')print(set3)# 并集 （合并两个 set 集合的元素并去除重复的值）set4=set1 | set2print('\n并集 set4:')print(set4)# 差集set5=set1 - set2set6=set2 - set1print('\n差集 set5:')print(set5)print('\n差集 set6:')print( set6)# 去除海量列表里重复元素，用 hash 来解决也行，只不过感觉在性能上不是很高，用 set 解决还是很不错的list1 = [111,222,333,444,111,222,333,444,555,666]  set7=set(list1)print('\n去除列表里重复元素 set7:')print(set7)

运行的结果：

{'h', 'l', 'e', 'o'}{'h', 'n', 'o', 'y', 'p'}交集 set3:{'h', 'o'}并集 set4:{'h', 'p', 'n', 'e', 'o', 'y', 'l'}差集 set5:{'l', 'e'}差集 set6:{'p', 'y', 'n'}去除列表里重复元素 set7:{555, 333, 111, 666, 444, 222}