python与数据挖掘-笔记2

来源：互联网发布：联通云计算公司编辑：程序博客网时间：2024/06/01 09:03

1，python的数据结构可以分为三种类型：标量（scaler），序列（sequence），映射（mapping）
1.1，序列：python中最为基础的内建类型，分为七种类型：列表，字符串，元组，Unicode字符串，字节数组，缓冲区和xrang对象
1.2，映射：python中实现的是字典（dictionary）
1.3，集合（set）是独立与标量、序列、映射之外的特殊数据结构，它支持数学理论的各种集合运算
2，列表 [ ]
2.1，列表的大小是可变的
2.2，列表没有固定的数据类型的约束
2.3，列表是有序的
2.4，列表可以通过下标（索引）访问，索引正向从0开始，可以为负值，list[-1]标识倒数第一个元素，list[-2]标识倒数第二个元素
2.5，列表支持切片，list[0:2]返回list第0个，第1个元素，不包括第2个元素，等同于list[:2]

2.6，列表有很多函数，包括插入、查找、合并等等

2.7，列表可以很容易当做栈来使用，使用append()压入、使用pop()弹出
2.8，列表可以使用做队列，但是效率很低，因为弹出对头元素，后面的所有元素需要向前移
2.9，Python中可以使用collections.deque作为队列，他设计的可以在两端快速的添加和弹出元素
3，字符串'',"",'''' '''', """ """
3.1，字符串可以通过索引（下标）访问，支持切片
3.2，字符串具有不可变性
3.3，创建字符串可以使用单引号或者双引号，两种方法没区别
3.4，字符串支持跨行，使用三个单引号或者三个双引号
3.5，跨行字符串的行尾换行符会被包含到字符串中，可以通过反斜杠（\）来消除
3.6，支持格式化，"there are{0} apples {1} on desk".formate(3,"on")
4，Unicode字符串u' ',u" ",u'''' '''', u""" """
4.1，创建Unicode字符串需要在字符串前加上u
4.2，encode()函数能够将Unicode字符串转换为指定编码的字符串，decode()或者unicode()函数可以反过来将指定编码的字符串转换为Unicode字符串
5，元组 ( )
5.1，元组与列表唯一不同的是具有不可变性
5.2，元组没有固定数据类型约束
5.3，元组可以作为字典的key，但是列表不可以
6，字典 { }
6.1，字典内部实现是基于二叉树的
6.2，字典中数据没有严格的顺序
6.3，字典的效率比列表差
6.4，字典是无序的，如果要字典按着一定得规则打印出来，需要获取素有键值，然后对键值排序，再遍历键值查询字典
7，集合 { }
7.1，集合是唯一的不可变的对象的一个无序的集合
7.2，集合支持数学理论对应的操作，如并和交。
7.3，x-y集合的差，x|y集合的并，x&y集合的交，x^y集合的异或，x>y如果x真包含y返回true否则为false

阅读全文

0 0