python学习笔记(五)集合(set)

来源:互联网 发布:clover软件干嘛的 编辑:程序博客网 时间:2024/05/30 02:25

set 拥有类似 dict 的特点:可以用{}花括号来定义;其中的元素没有序列,也就是是非序列类型的数据;而且,set 中的元素不可重复,这就类似 dict 的键.

set 也有一点 list 的特点:有一种集合可以原处修改.

下面通过实验,进一步理解创建 set 的方法:

>>> s1 = set("qiwsir")  >>> s1                  set(['q', 'i', 's', 'r', 'w'])

把 str 中的字符拆解开,形成 set.特别注意观察:qiwsir 中有两个 i,但是在 s1 中,只有一个 i,也就是集合中元素不能重复。

>>> s2 = set([123,"google","face","book","facebook","book"])>>> s2set(['facebook', 123, 'google', 'book', 'face'])                

在创建集合的时候,如果发现了重复的元素,就会过滤一下,剩下不重复的。而且,从 s2 的创建可以看出,查看结果是显示的元素顺序排列与开始建立是不同,完全是随意显示的,这说明集合中的元素没有序列。

>>> s3 = {"facebook",123}       #通过{}直接创建>>> s3set([123, 'facebook'])

然后用 help()可以找到每个函数的具体使用方法,下面列几个例子:

add, update

>>> help(set.add)Help on method_descriptor:add(...)Add an element to a set.  This has no effect if the element is already present.

下面在交互模式这个最好的实验室里面做实验:

>>> a_set = {}              #我想当然地认为这样也可以建立一个 set>>> a_set.add("qiwsir")     #报错.看看错误信息,居然告诉我 dict 没有 add.我分明建立的是 set 呀.Traceback (most recent call last):  File "<stdin>", line 1, in <module>AttributeError: 'dict' object has no attribute 'add'>>> type(a_set)             #type 之后发现,计算机认为我建立的是一个 dict     <type 'dict'>

特别说明一下,{}这个东西,在 dict 和 set 中都用.但是,如上面的方法建立的是 dict,不是 set.这是 Python 规定的.要建立 set,只能用前面介绍的方法了.

>>> a_set = {'a','i'}       #这回就是 set 了吧>>> type(a_set)  <type 'set'>              #果然>>> a_set.add("qiwsir")     #增加一个元素>>> a_set                   #原处修改,即原来的 a_set 引用对象已经改变set(['i', 'a', 'qiwsir'])>>> b_set = set("python")>>> type(b_set)<type 'set'>>>> b_setset(['h', 'o', 'n', 'p', 't', 'y'])>>> b_set.add("qiwsir")>>> b_setset(['h', 'o', 'n', 'p', 't', 'qiwsir', 'y'])>>> b_set.add([1,2,3])      #报错.list 是不可哈希的,集合中的元素应该是 hashable 类型。Traceback (most recent call last):  File "<stdin>", line 1, in <module>TypeError: unhashable type: 'list'>>> b_set.add('[1,2,3]')    #可以这样!>>> b_setset(['[1,2,3]', 'h', 'o', 'n', 'p', 't', 'qiwsir', 'y'])

除了上面的增加元素方法之外,还能够从另外一个 set 中合并过来元素,方法是 set.update(s2)

>>> help(set.update)update(...)    Update a set with the union of itself and others.>>> s1set(['a', 'b'])>>> s2set(['github', 'qiwsir'])>>> s1.update(s2)       #把 s2 的元素并入到 s1 中.>>> s1                  #s1 的引用对象修改set(['a', 'qiwsir', 'b', 'github'])>>> s2                  #s2 的未变set(['github', 'qiwsir'])

pop, remove, discard, clear

>>> help(set.pop)pop(...)    Remove and return an arbitrary set element.    Raises KeyError if the set is empty.>>> b_setset(['[1,2,3]', 'h', 'o', 'n', 'p', 't', 'qiwsir', 'y'])>>> b_set.pop()     #从 set 中任意选一个删除,并返回该值'[1,2,3]'>>> b_set.pop()'h'>>> b_set.pop()'o'>>> b_setset(['n', 'p', 't', 'qiwsir', 'y'])>>> b_set.pop("n")  #如果要指定删除某个元素,报错了.Traceback (most recent call last):  File "<stdin>", line 1, in <module>TypeError: pop() takes no arguments (1 given)

set.pop()是从 set 中任意选一个元素,删除并将这个值返回.但是,不能指定删除某个元素.报错信息中就告诉我们了,pop()不能有参数.此外,如果 set 是空的了,也报错.这条是帮助信息告诉我们的,看官可以试试.

要删除指定的元素,怎么办?

>>> help(set.remove)remove(...)    Remove an element from a set; it must be a member.        If the element is not a member, raise a KeyError.

set.remove(obj)中的 obj,必须是 set 中的元素,否则就报错.试一试:

>>> a_setset(['i', 'a', 'qiwsir'])>>> a_set.remove("i")>>> a_setset(['a', 'qiwsir'])>>> a_set.remove("w")Traceback (most recent call last):  File "<stdin>", line 1, in <module>KeyError: 'w'

跟 remove(obj)类似的还有一个 discard(obj):

>>> help(set.discard)discard(...)    Remove an element from a set if it is a member.    If the element is not a member, do nothing.

help(set.remove)的信息对比,看看有什么不同.discard(obj)中的 obj 如果是 set 中的元素,就删除,如果不是,就什么也不做,do nothing.新闻就要对比着看才有意思呢.这里也一样.

>>> a_set.discard('a')>>> a_set       set(['qiwsir'])>>> a_set.discard('b')>>>

在删除上还有一个绝杀,就是 set.clear(),它的功能是:Remove all elements from this set.(看官自己在交互模式下 help(set.clear))

>>> a_setset(['qiwsir'])>>> a_set.clear()>>> a_setset([])>>> bool(a_set)     #空了,bool 一下返回 False.False

集合运算

唤醒一下中学数学(准确说是高中数学中的一点知识)中关于集合的一点知识,当然,你如果是某个理工科的专业大学毕业,更应该熟悉集合之间的关系。

元素与集合的关系

就一种关系,要么术语某个集合,要么不属于。

>>> asetset(['h', 'o', 'n', 'p', 't', 'y'])>>> "a" in asetFalse>>> "h" in asetTrue

集合与集合的关系

假设两个集合 A、B

  • A 是否等于 B,即两个集合的元素完全一样

在交互模式下实验

>>> a           set(['q', 'i', 's', 'r', 'w'])>>> bset(['a', 'q', 'i', 'l', 'o'])>>> a == bFalse>>> a != bTrue
  • A 是否是 B 的子集,或者反过来,B 是否是 A 的超集。即 A 的元素也都是 B 的元素,但是 B 的元素比 A 的元素数量多。

判断集合 A 是否是集合 B 的子集,可以使用 A<B,返回 true 则是子集,否则不是。另外,还可以使用函数 A.issubset(B)判断。

>>> aset(['q', 'i', 's', 'r', 'w'])>>> cset(['q', 'i'])>>> c<a     #c 是 a 的子集True>>> c.issubset(a)   #或者用这种方法,判断 c 是否是 a 的子集True>>> a.issuperset(c) #判断 a 是否是 c 的超集True>>> bset(['a', 'q', 'i', 'l', 'o'])>>> a<b     #a 不是 b 的子集False>>> a.issubset(b)   #或者这样做False
  • A、B 的并集,即 A、B 所有元素,如下图所示

可以使用的符号是“|”,是一个半角状态写的竖线,输入方法是在英文状态下,按下"shift"加上右方括号右边的那个键。找找吧。表达式是 A | B.也可使用函数 A.union(B),得到的结果就是两个集合并集,注意,这个结果是新生成的一个对象,不是将结合 A 扩充。

>>> aset(['q', 'i', 's', 'r', 'w'])>>> bset(['a', 'q', 'i', 'l', 'o'])>>> a | b                       #可以有两种方式,结果一样set(['a', 'i', 'l', 'o', 'q', 's', 'r', 'w'])>>> a.union(b)set(['a', 'i', 'l', 'o', 'q', 's', 'r', 'w'])
  • A、B 的交集,即 A、B 所公有的元素,如下图所示

>>> aset(['q', 'i', 's', 'r', 'w'])>>> bset(['a', 'q', 'i', 'l', 'o'])>>> a & b       #两种方式,等价set(['q', 'i'])>>> a.intersection(b)set(['q', 'i'])

我在实验的时候,顺手敲了下面的代码,出现的结果如下,看官能解释一下吗?(思考题)

>>> a and bset(['a', 'q', 'i', 'l', 'o'])
  • A 相对 B 的差(补),即 A 相对 B 不同的部分元素,如下图所示

>>> aset(['q', 'i', 's', 'r', 'w'])>>> bset(['a', 'q', 'i', 'l', 'o'])>>> a - bset(['s', 'r', 'w'])>>> a.difference(b)set(['s', 'r', 'w'])

-A、B 的对称差集,如下图所示

>>> aset(['q', 'i', 's', 'r', 'w'])>>> bset(['a', 'q', 'i', 'l', 'o'])>>> a.symmetric_difference(b)set(['a', 'l', 'o', 's', 'r', 'w'])

以上是集合的基本运算。在编程中,如果用到,可以用前面说的方法查找。不用死记硬背。


原创粉丝点击