python与数据挖掘-笔记2

来源:互联网 发布:联通云计算公司 编辑:程序博客网 时间:2024/06/01 09:03
1,python的数据结构可以分为三种类型:标量(scaler),序列(sequence),映射(mapping)
1.1,序列:python中最为基础的内建类型,分为七种类型:列表,字符串,元组,Unicode字符串,字节数组,缓冲区和xrang对象
1.2,映射:python中实现的是字典(dictionary)
1.3,集合(set)是独立与标量、序列、映射之外的特殊数据结构,它支持数学理论的各种集合运算
2,列表 [ ]
2.1,列表的大小是可变的
2.2,列表没有固定的数据类型的约束
2.3,列表是有序的
2.4,列表可以通过下标(索引)访问,索引正向从0开始,可以为负值,list[-1]标识倒数第一个元素,list[-2]标识倒数第二个元素
2.5,列表支持切片,list[0:2]返回list第0个,第1个元素,不包括第2个元素,等同于list[:2]

2.6,列表有很多函数,包括插入、查找、合并等等

2.7,列表可以很容易当做栈来使用,使用append()压入、使用pop()弹出
2.8,列表可以使用做队列,但是效率很低,因为弹出对头元素,后面的所有元素需要向前移
2.9,Python中可以使用collections.deque作为队列,他设计的可以在两端快速的添加和弹出元素
3,字符串'',"",'''' '''', """ """
3.1,字符串可以通过索引(下标)访问,支持切片
3.2,字符串具有不可变性
3.3,创建字符串可以使用单引号或者双引号,两种方法没区别
3.4,字符串支持跨行,使用三个单引号或者三个双引号
3.5,跨行字符串的行尾换行符会被包含到字符串中,可以通过反斜杠(\)来消除
3.6,支持格式化,"there are{0} apples {1} on desk".formate(3,"on")
4,Unicode字符串u' ',u" ",u'''' '''', u""" """
4.1,创建Unicode字符串需要在字符串前加上u
4.2,encode()函数能够将Unicode字符串转换为指定编码的字符串,decode()或者unicode()函数可以反过来将指定编码的字符串转换为Unicode字符串
5,元组 ( )
5.1,元组与列表唯一不同的是具有不可变性
5.2,元组没有固定数据类型约束
5.3,元组可以作为字典的key,但是列表不可以
6,字典 { }
6.1,字典内部实现是基于二叉树的
6.2,字典中数据没有严格的顺序
6.3,字典的效率比列表差
6.4,字典是无序的,如果要字典按着一定得规则打印出来,需要获取素有键值,然后对键值排序,再遍历键值查询字典
7,集合 { }
7.1,集合是唯一的不可变的对象的一个无序的集合
7.2,集合支持数学理论对应的操作,如并和交。
7.3,x-y集合的差,x|y集合的并,x&y集合的交,x^y集合的异或,x>y如果x真包含y返回true否则为false

原创粉丝点击