Python学习之旅-16

来源:互联网 发布:淘宝店铺装修图片素材 编辑:程序博客网 时间:2024/05/20 23:32

文件处理

文件处理流程

  1. 打开文件,得到文件句柄并赋值给一个变量
  2. 通过句柄对文件进行操作
  3. 关闭文件

基本操作

  • 2.1 文件操作基本流程初探
f = open('chenli.txt') #打开文件first_line = f.readline()print('first line:',first_line) #读一行print('我是分隔线'.center(50,'-'))data = f.read()# 读取剩下的所有内容,文件大时不要用print(data) #打印读取内容f.close() #关闭文件
  • 2.2 文件编码
#不指定打开编码,默认使用操作系统的编码,windows为gbk,linux为utf-8,与解释器编码无关 f=open('chenli.txt',encoding='gbk') #在windows中默认使用的也是gbk编码,此时不指定编码也行 f.read()
  • 2.3 文件打开模式
    文件句柄 = open(‘文件路径’, ‘模式’)

     打开文件时,需要指定文件路径和以何等方式打开文件,打开后,即可获取该文件句柄,日后通过此文件句柄对该文件操作。

     打开文件的模式有:

    • r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
    • w,只写模式【不可读;不存在则创建;存在则清空内容】
    • x, 只写模式【不可读;不存在则创建,存在则报错】
    • a, 追加模式【可读; 不存在则创建;存在则只追加内容】

    “+” 表示可以同时读写某个文件

    • r+, 读写【可读,可写】
    • w+,写读【可读,可写】
    • x+ ,写读【可读,可写】
    • a+, 写读【可读,可写】

    “b”表示以字节的方式操作

    • rb 或 r+b
    • wb 或 w+b
    • xb 或 w+b
    • ab 或 a+b

    注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码

  • 2.4 文件内置函数flush
    flush原理:
    1.文件操作是通过软件将文件从硬盘读到内存
    2.写入文件的操作也都是存入内存缓冲区buffer(内存速度快于硬盘,如果写入文件的数据都从内存刷到硬盘,内存与硬盘的速度延迟会被无限放大,效率变低,所以要刷到硬盘的数据我们统一往内存的一小块空间即buffer中放,一段时间后操作系统会将buffer中数据一次性刷到硬盘)
    3.flush即,强制将写入的数据刷到硬盘
    滚动条:
import sys,timefor i in  range(10):    sys.stdout.write('#')    sys.stdout.flush()    time.sleep(0.2)
  • 2.5 文件内光标移动
    注意:read(3)代表读取3个字符,其余的文件内光标移动都是以字节为单位如seek,tell,read,truncate
  • 2.6 open函数详解

    1. open()语法
      open(file[, mode[, buffering[, encoding[, errors[, newline[, closefd=True]]]]]])
      open函数有很多的参数,常用的是file,mode和encoding
      file文件位置,需要加引号
      mode文件打开模式,见下面3
      buffering的可取值有0,1,>1三个,0代表buffer关闭(只适用于二进制模式),1代表line buffer(只适用于文本模式),>1表示初始化的buffer大小;
      encoding表示的是返回的数据采用何种编码,一般采用utf8或者gbk;
      errors的取值一般有strict,ignore,当取strict的时候,字符编码出现问题的时候,会报错,当取ignore的时候,编码出现问题,程序会忽略而过,继续执行下面的程序。
      newline可以取的值有None, \n, \r, ”, ‘\r\n’,用于区分换行符,但是这个参数只对文本模式有效;
      closefd的取值,是与传入的文件参数有关,默认情况下为True,传入的file参数为文件的文件名,取值为False的时候,file只能是文件描述符,什么是文件描述符,就是一个非负整数,在Unix内核的系统中,打开一个文件,便会返回一个文件描述符。

    2. Python中file()与open()区别
      两者都能够打开文件,对文件进行操作,也具有相似的用法和参数,但是,这两种文件打开方式有本质的区别,file为文件类,用file()来打开文件,相当于这是在构造文件类,而用open()打开文件,是用python的内建函数来操作,建议使用open

    3. 参数mode的基本取值

CharacterMeaning‘r’open for reading (default)‘w’open for writing, truncating the file first‘a’open for writing, appending to the end of the file if it exists‘b’binary mode‘t’text mode (default)‘+’open a disk file for updating (reading and writing)‘U’universal newline mode (for backwards compatibility; should not be used in new code)

  r、w、a为打开文件的基本模式,对应着只读、只写、追加模式;
  b、t、+、U这四个字符,与以上的文件打开模式组合使用,二进制模式,文本模式,读写模式、通用换行符,根据实际情况组合使用、

常见的mode取值组合```r或rt 默认模式,文本模式读rb   二进制文件w或wt 文本模式写,打开前文件存储被清空wb  二进制写,文件存储同样被清空a  追加模式,只能写在文件末尾a+ 可读写模式,写只能写在文件末尾w+ 可读写,与a+的区别是要清空文件内容r+ 可读写,与a+的区别是可以写到文件任何位置 ```

- 2.7 上下文管理

with open('a.txt','w') as f:    pass
with open('a.txt','r') as read_f,open('b.txt','w') as write_f:    data=read_f.read()    write_f.write(data)
  • 2.8 文件的修改
import oswith open('a.txt','r',encoding='utf-8') as read_f,\        open('.a.txt.swap','w',encoding='utf-8') as write_f:    for line in read_f:        if line.startswith('hello'):            line='哈哈哈\n'        write_f.write(line)os.remove('a.txt')os.rename('.a.txt.swap','a.txt')
原创粉丝点击