python手册

来源：互联网发布：知字的草书写法编辑：程序博客网时间：2024/05/21 16:32

写在前面：本文专注于python常见的内置函数、模块，不包括numpy、scipy、pandas等

1.utf-8编码

# -*- coding: utf-8 -*-

2.内存管理

import gcdel obj    #删除对象名gc.collect()

3.文件读取

以如下文件为例，文件名为test.txt，文本内容如下：

WIFIAPTag,passengerCount,timeStampE1-1A-1<E1-1-01>,15,2016-09-10-18-55-04E1-1A-2<E1-1-02>,15,2016-09-10-18-55-04E1-1A-3<E1-1-03>,38,2016-09-10-18-55-04

示例1

with open(name='test.txt',mode='r') as file:    print file.readline()    print file.readline()    file.seek(0)    print file.readline()

输出1

WIFIAPTag,passengerCount,timeStamp

E1-1A-1,15,2016-09-10-18-55-04

WIFIAPTag,passengerCount,timeStamp

分析1

1. print函数输出会自动换行，函数原型print(*objects, sep=’ ‘, end=’\n’, file=sys.stdout, flush=False)。
解决办法:
Python 2：from future import print_function print(“hello”,end=”)
Python 3：输入参数end：print (‘hello’, end=”)。
2. with open 的组合可以取代 open close这样的文件操作，由with进行管理文件关闭。
3. readline()方法表示从文件中读取一行，且有一个文件指针，当使用file.seek(0)，指针指向文件起始处。

示例2

with open(name='test.txt',mode='r') as file:    column_names =  file.readline().strip().split(',')    print column_names    data = []    for line in file:        (wifi_ap_tag,passenger_count,time_stamp) = line.strip().split(',')        data.append([wifi_ap_tag,passenger_count,time_stamp])    print data

输出2

[‘WIFIAPTag’, ‘passengerCount’, ‘timeStamp’]
[[‘E1-1A-1’, ‘15’, ‘2016-09-10-18-55-04’], [‘E1-1A-2’, ‘15’, ‘2016-09-10-18-55-04’], [‘E1-1A-3’, ‘38’, ‘2016-09-10-18-55-04’]]

分析2

1. strip()去除多余的空格
2. split(‘,’)，以逗号为分隔符进行划分. split(‘,’,maxsplit=1)可以使用maxsplit控制最多只划分一次.

示例3

#文本追加with open(name='test.txt',mode='a') as file:    file.write('\nhello python')

输出3

WIFIAPTag,passengerCount,timeStamp
E1-1A-1,15,2016-09-10-18-55-04
E1-1A-2,15,2016-09-10-18-55-04
E1-1A-3,38,2016-09-10-18-55-04
hello python

分析3

r以读方式打开文件，可读取文件信息。
w以写方式打开文件，可向文件写入信息。如文件存在，则清空该文件，再写入新内容
a以追加模式打开文件（即一打开文件，文件指针自动移到文件末尾），如果文件不存在则创建
r+以读写方式打开文件，可对文件进行读和写操作。
w+消除文件内容，然后以读写方式打开文件。
a+以读写方式打开文件，并把文件指针移到文件尾。
b以二进制模式打开文件，而不是以文本模式。该模式只对Windows或Dos有效，类Unix的文件是用二进制模式进行操作的。

4.异常处理

代码

try:    data = open(name='1.txt',mode='r')except IOError as err:    print 'File error : ' + str(err)finally:    if 'data' in locals():  #locals()会返回当前作用域中定义所有名的一个集合        data.close()

输出

File error : [Errno 2] No such file or directory: ‘1.txt’

5.列表推导项、去重复项、取降序top 3

a = [1,2,3,4,5,4,6,8]x = sorted(set([(item*item) for item in a if item > 3]),reverse=True)[0:3]print x#输出  [64, 36, 25]#set() 表示集合#对数据完成复制排序 data2 = sorted()#对数据完成原地排序 data.sort()#默认排序是升序,使用reverse=True可以降序输出#函数原型 sorted(iterable, cmp=None, key=None, reverse=False)

6.内置函数lambda、filter、map、reduce、zip、enumerate

（1）匿名函数lambda。原型lambda [arg1[,arg2,arg3,…,argn]] : expression

>>> add = lambda x,y : x + y  >>> add(1,2)  3

（2）filter(bool_func,seq)：此函数的功能相当于过滤器。调用一个布尔函数bool_func来迭代遍历每个seq中的元素；返回一个使bool_seq返回值为true的元素的序列。

>>> filter(lambda x : x%2 == 0,[1,2,3,4,5])  [2, 4]

（3）map(func,seq1[,seq2…])：将函数func作用于给定序列的每个元素，并用一个列表来提供返回值；如果func为None，func表现为身份函数，返回一个含有每个序列中元素集合的n个元组的列表。

>>> map(lambda x : None,[1,2,3,4])  [None, None, None, None]  >>> map(lambda x : x * 2,[1,2,3,4])  [2, 4, 6, 8]  >>> map(lambda x : x * 2,[1,2,3,4,[5,6,7]])  [2, 4, 6, 8, [5, 6, 7, 5, 6, 7]]  >>> map(lambda x : None,[1,2,3,4])  [None, None, None, None]

（4）reduce(func,seq[,init])：func为二元函数，将func作用于seq序列的元素，每次携带一对（先前的结果以及下一个序列的元素），连续的将现有的结果和下一个值作用在获得的随后的结果上，最后减少我们的序列为一个单一的返回值：如果初始值init给定，第一个比较会是init和第一个序列元素而不是序列的头两个元素。

>>> reduce(lambda x,y : x + y,[1,2,3,4])  10  >>> reduce(lambda x,y : x + y,[1,2,3,4],10)  20

（5）zip

zip(seq1 [, seq2 […]]) -> [(seq1[0], seq2[0] …), (…)]

x = [1, 2, 3]y = [4, 5, 6, 7]xy = zip(x, y)#输出 [(1, 4), (2, 5), (3, 6)]

（6）enumerate

for i,j in enumerate(('a','b','c')):    print i,j#输出#0 a#1 b#2 c

7.time模块

import timetime.time()         #获取当前时间戳time.localtime()    #当前时间的struct_time形式time.ctime()        #当前时间的字符串形式#格式化成2016-11-16 14:45:39形式time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()) #统计程序运行时间from time import clockt_finish = clock()t_finish = clock()print('==============运行时间为：%s 秒==============' % str(t_finish - t_start))

8.pickle模块

import pickle#以保存模型参数为例with open(name='test.pickle',mode='wb') as save_file:      #‘b’表示二进制模式    pickle.dump({'depth':8,'ntree':100},save_file)with open(name='test.pickle',mode='rb') as restored_file:    para = pickle.load(restored_file)print para['depth']print para['ntree']

9.os模块

import osos.getcwd()                 #当前工作目录os.chdir('../python/code')  #注意.与..的区别#新建文件夹if not os.path.exists('submit'):    os.mkdir('submit')

10.列表

list：列表（即动态数组，C++标准库的vector，但可含不同类型的元素于一个list中）
a = [“I”,”you”,”he”,”she”] ＃元素可为任何类型。

下标：按下标读写，就当作数组处理
- 以0开始，有负下标的使用，0第一个元素，-1最后一个元素，-len第一个元素，len-1最后一个元素
  取list的元素数
  - len(list) #list的长度。实际该方法是调用了此对象的len(self)方法
创建连续的list
- L = range(1,5) #即 L=[1,2,3,4],不含最后一个元素
- L = range(1, 10, 2) #即 L=[1, 3, 5, 7, 9]
list的方法
- L.append(var) #追加元素
- L.insert(index,var)
- L.pop(var) #返回最后一个元素，并从list中删除之
- L.remove(var) #删除第一次出现的该元素
- L.count(var) #该元素在列表中出现的个数
- L.count(var) #该元素在列表中出现的个数
- L.index(var) #该元素的位置,无则抛异常
- L.extend(list) #追加list，即合并list到L上
- L.sort() #排序
- L.reverse() #倒序
list 操作符:,+,*，关键字del
- a[1:] #片段操作符，用于子list的提取
- [1,2]+[3,4] #为[1,2,3,4]。同extend()
- [2]*4 #为[2,2,2,2]
- del L[1] #删除指定下标的元素
- del L[1:3] #删除指定下标范围的元素
list的复制
- L1 = L #L1为L的别名，用C来说就是指针地址相同，对L1操作即对L操作。函数参数就是这样传递的
- L1 = L[:] #L1为L的克隆，即另一个拷贝。
list comprehension（推导列表）
- [ for k in L if ]
list 和 tuple 的相互转化
- tuple(ls)
- list(ls)

11.字典

dictionary：字典（即C++标准库的map）

dict = {‘ob1’:’computer’, ‘ob2’:’mouse’, ‘ob3’:’printer’}
每一个元素是pair，包含key、value两部分。key是Integer或string类型，value 是任意类型。
键是唯一的，字典只认最后一个赋的键值。

dictionary的方法

D.get(key, 0) #同dict[key]，多了个没有则返回缺省值，0。[]没有则抛异常
D.has_key(key) #有该键返回TRUE，否则FALSE
D.keys() #返回字典键的列表
D.values()
D.items()
D.update(dict2) #增加合并字典
D.popitem() #得到一个pair，并从字典中删除它。已空则抛异常
D.clear() #清空字典，同del dict
D.copy() #拷贝字典
D.cmp(dict1,dict2) #比较字典，(优先级为元素个数、键大小、键值大小)
#第一个大返回1，小返回-1，一样返回0

dictionary的复制

dict1 = dict #别名
dict2=dict.copy() #克隆，即另一个拷贝

字典的遍历

（1）遍历字典的key（键）

for key in dict.keys():    print key

（2）遍历字典的value（值）

for value in dict.values():    print value

（3）遍历字典的项（元素）

for item in dict.items():    print item

（4）遍历字典的key-value

for item，value in dict.items():     print ‘key=%s, value=%s' %(item, value)  或   for item，value in dict.iteritems():     print ‘key=%s, value=%s' %(item, value)

12.字符串

string：字符串（即不能修改的字符list）

str = “Hello World”
字符串是一个整体。如果你想直接修改字符串的某一部分，是不可能的。但我们能够读出字符串的某一部分。

子字符串的提取str[:6]

字符串包含判断操作符：in，not in

”He” in str
“she” not in str

string模块方法

S.find(substring, [start [,end]]) #可指范围查找子串，返回索引值，否则返回-1
S.rfind(substring,[start [,end]]) #反向查找
S.index(substring,[start [,end]]) #同find，只是找不到产生ValueError异常
S.rindex(substring,[start [,end]])#同上反向查找
S.count(substring,[start [,end]]) #返回找到子串的个数
S.lowercase()
S.capitalize() #首字母大写
S.lower() #转小写
S.upper() #转大写
S.swapcase() #大小写互换
S.split(str, ’ ‘) #将string转list，以空格切分
S.join(list, ’ ‘) #将list转string，以空格连接

处理字符串的内置函数

len(str) #串长度
cmp(“my friend”, str) #字符串比较。第一个大，返回1
max(‘abcxyz’) #寻找字符串中最大的字符
min(‘abcxyz’) #寻找字符串中最小的字符

string的转换

oat(str) #变成浮点数，float(“1e-1”) 结果为0.1
int(str) #变成整型， int(“12”) 结果为12
int(str,base) #变成base进制整型数，int(“11”,2) 结果为2
long(str) #变成长整型，
long(str,base) #变成base进制长整型，

字符串的格式化（注意其转义字符，大多如C语言）

str_format % (参数列表) #参数列表是以tuple的形式定义的，即不可运行中改变
print “”%s’s height is %dcm” % (“My brother”, 180)
#结果显示为 My brother’s height is 180cm

0 0