Python文本读取笔记

来源:互联网 发布:在线数据图表处理软件 编辑:程序博客网 时间:2024/06/11 09:33

Python中文本读取的方法

1、最好使用with来打开文件,如下

with open(file_name,'r') as f

2、读取文件内容的方法有三种: read(), readline(), readlines(), 每种方法可接受一个变量来限制每次读取的数据量, 但它们通常不使用变量。

read(), 每次读取整个文件,通常用于将文件内容放到一个字条串变量中, 但对于连续的面向行的处理,它却是不必要的,并且如果文件大于可用内存,则不可能实现这种处理。

readline() 和 readlines() 之间的差异是后者一次读取整个文件,像read() 一样。readlines() 自动将文件内容分析成一个行的列表,该列表可以由 Python 的 for ... in ... 结构进行处理。另一方面,readline() 每次只读取一行,通常比 readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时,才应该使用 readline()。


3、接下来就是读取到字符串。 假设读取到的对象为line, 先用line.strip()和line.split()两个函数来给对象line瘦身和分割,就能得到我们想要的字符串列表了。

list_str = []for line in f.readlines()    line_str = line.strip().split()    list_str = list_str.append(line_str)

4、如果想返回一个numpy类型数组,只需要加一句

return numpy.array(list_str)

^^^这里的strip()函数是用来去掉空格回车的,参数称为删除序列。 在有参数rm的情况下,line.strip(rm)表示删除掉line从前、后开始数,位于删除序列rm中的字符;在参数为空的情况下,默认删除空白字符(包括‘ ’,‘\t', '\n', '\r')。这里要特别注意删除的顺序,是从头尾两端开始删除,一旦遇到不在删除序列中的字符,就会停止向中间检索。

^^^这里的split()函数是用来分割的,在有参数的情况下,line.split(str)表示以字符str为界限分割line, 如果有两个参数,line.split(str,N)表示以字符str为界限分割line N次;在参数为空的情况下,默认删除空白字符,如上。


总结:这是常用的数据处理中的文本读取方法,希望能熟练掌握!


0 0