【七月Python入门】 第五课面文件访问与函数式编程入门

来源:互联网 发布:方便面 数据报告 编辑:程序博客网 时间:2024/04/30 20:11

1.文本文件读写三种方法:

(1)直接读入

file1 = open("test.txt") file2 = open("output.txt","w") while True:     line = file1.readline()     #这里可以进行逻辑处理     file2.write('"'+line[:s]+'"'+",")     if not line:         break #记住文件处理完,关闭是个好习惯 file1.close() file2.close() 
注意:read()将文本文件所有行读到一个字符串中。 readline()是一行一行的读 。readlines()是将文本文件中所有行读到一个list中,文本文件每一行是list的一个元素。 优点:readline()可以在读行过程中跳过特定行。


(2)文件迭代器,用for循环的方法

file2 = open("output.txt","w") for line in open("test.txt"):       #这里可以进行逻辑处理     file2.write('"'+line[:s]+'"'+",")


(3)文件上下文管理器 (好处在于不需要自己关闭文件)

#打开文件#用with..open自带关闭文本的功能with open('somefile.txt', 'r') as f:     data = f.read() # loop整个文档with open('somefile.txt', 'r') as f:     for line in f:         # 处理每一行# 写入文本 with open('somefile.txt', 'w') as f:     f.write(text1)     f.write(text2)     ... # 把要打印的line写入文件中 with open('somefile.txt', 'w') as f:     print(line1, file=f)     print(line2, file=f)

2.二进制文件读写:python默认的是文本文件的读写,如果要二进制文件读写,需要加上‘b’。例如:需要把刚刚的'r'改成'rb'。

f = open('EDC.jpg', 'rb')print(f.read())# 输出 '\xff\xd8\xff\xe1\x00\x18Exif\x00\x00...' # 十六进制表示的字节
需要用二进制读入这个文件,然后再用 .decode('...')的方法来解码这个二进制文件:

f = open('DegangGuo.txt', 'rb')# 读入郭德纲老师的作文, 但是郭老师用的是参合着错别字的繁体编码,假设叫个"DeyunCode"# 那么你读入以后,就需要解码它u = f.read().decode('DeyunCode')


3.通过os.path.split()函数,这样可以把一个路径拆分为两部分,后一部分总是最后级别的目录或文件名:

os.path.split('/Users/EDC/Pictures/AJiao.avi')# ('/Users/EDC/Pictures/', 'AJiao.avi')

os.path.splitext()得到文件扩展名:

os.path.splitext('/Users/EDC/Pictures/AJiao.avi')# ('/Users/EDC/Pictures/AJiao', '.avi')

4.什么是序列化?

程序运行的过程中,所有变量都是在内存中操作的,当程序一旦执行完毕,结束退出后,变量占有的内存就被操作系统回收了。 因此我们需要将某些数据持久化存储到磁盘中,下次运行的时候从磁盘中读取相关数据。我们将变量从内存中变成可以存储或传输的过程称之为序列化,在Python中叫做pickling,在其它语言中也称之为 serialization、marshaling、flattening等等,说的都是一个意思。 反之,则为反序列化,称之为unpickling,把变量内容从序列化的对象重新读取到内存中。

序列化:

import pickle# 此处定义一个dict字典对象d = dict(name='思聪', age=29, score=80)str = pickle.dumps(d) # 调用pickle的dumps函数进行序列化处理print(str)# 你可以看看它长什么样子# 定义和创建一个file文件对象,设定模式为wbf = open('dump.txt', 'wb')# 将内容序列化写入到file文件中pickle.dump(d, f)f.close() # 最后关闭掉文件资源

反序列化:

import pickle# 从之前序列化的dump.txt文件里边读取内容f = open('dump.txt', 'rb') # 设定文件选项模式为rbd = pickle.load(f) # 调用load做反序列处理过程f.close() # 关闭文件资源print(d)print('name is %s' % d['name'])


5.我们可以用JSON来做序列化。Python的数据结构跟Json有非常完美的兼容:
JSON类型Python类型{}dict[]list"string"'str'或者u'unicode'1234.56int或floattrue/falseTrue/FalsenullNone

如果你有一个比较结构化的数据想要序列化,并且想要别的地方别的语言也能看得懂。那么你可以用JSON来做:

import json # 定义dict字典对象d1 = dict(name='小王', age=20, score=80)str = json.dumps(d1) # 调用json的dumps函数进行json序列化处理print(str) # 调用json的loads函数进行反序列化处理d2 = json.loads(str)


6.可以把别的函数作为参数传入的函数叫高阶函数。


7.python 使用 lambda 来创建匿名函数。lambda只是一个表达式,函数体比def简单很多。lambda的主体是一个表达式,而不是一个代码块。仅仅能在lambda表达式中封装有限的逻辑进去。lambda函数拥有自己的命名空间,且不能访问自有参数列表之外或全局命名空间里的参数。虽然lambda函数看起来只能写一行,却不等同于C或C++的内联函数,后者的目的是调用小函数时不占用栈内存从而增加运行效率。Lambda函数的语法只包含一个语句,如下:

lambda [arg1 [,arg2,.....argn]]:expression

sum = lambda arg1, arg2: arg1 + arg2sum(10, 20)


8.除了lambda,还有其他的辅助函数。python中的reduce内建函数是一个二元操作函数,他用来将一个数据集合(列表,元组等)中的所有数据进行如下操作:传给reduce中的函数func() (必须是一个二元操作函数)先对集合中的第1,2个数据进行操作,得到的结果再与第三个数据用func()函数运算,最后得到一个结果。

from functools import reducel = [1,2,3,4,5]print(reduce(lambda x,y: x+y, l))# 这里代表着,把list中的值,一个个放进lamda的x,y中# 如果你给出一个初始值,可以放在list后面print(reduce(lambda x,y: x+y, l, 10))# 这样,x开始的时候被赋值为10,然后依次


9.map函数应用于每一个可迭代的项,返回的是一个结果list。如果有其他的可迭代参数传进来,map函数则会把每一个参数都以相应的处理函数进行迭代处理。map()函数接收两个参数,一个是函数,一个是序列,map将传入的函数依次作用到序列的每个元素,并把结果作为新的list返回。格式:map(func, seq1[, seq2...] )

l = [1,2,3]new_list = list(map(lambda i: i+1, l))print(new_list)# Py3里,外面需要套个list:# 这是为了让里面的值给显示出来,要不然你会得到这是个map函数# 而不是里面的值。# Py2的童鞋不虚# 我们也可以把两个数组搞成一个单独的数组l2 = [4,5,6]new_list = list(map(lambda x,y: x+y, l, l2))print(new_list)

10.filter()函数可以对序列做过滤处理,就是说可以使用一个自定的函数过滤一个序列,把序列的每一项传到自定义的过滤函数里处理,并返回结果做过滤。最终一次性返回过滤后的结果。 和map()类似,filter()也接收一个函数和一个序列。和map()不同的时,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。

l = [100, 20, 24, 50, 110]new = list(filter(lambda x: x<50, l))# 同理,py3得套个list来转化成list函数,便于打印出来print(new)


11.偏函数:偏函数又可以翻译成部分函数,大概意思就是说,只设置一部分参数。functools.partial就是帮助我们创建一个偏函数的:

import functoolsint2 = functools.partial(int, base=2)int2('1000000')



原创粉丝点击