Python文本读取笔记
来源:互联网 发布:在线数据图表处理软件 编辑:程序博客网 时间:2024/06/11 09:33
Python中文本读取的方法
1、最好使用with来打开文件,如下
with open(file_name,'r') as f
2、读取文件内容的方法有三种: read(), readline(), readlines(), 每种方法可接受一个变量来限制每次读取的数据量, 但它们通常不使用变量。
read(), 每次读取整个文件,通常用于将文件内容放到一个字条串变量中, 但对于连续的面向行的处理,它却是不必要的,并且如果文件大于可用内存,则不可能实现这种处理。
readline() 和 readlines() 之间的差异是后者一次读取整个文件,像read() 一样。readlines() 自动将文件内容分析成一个行的列表,该列表可以由 Python 的 for ... in ... 结构进行处理。另一方面,readline() 每次只读取一行,通常比 readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时,才应该使用 readline()。
3、接下来就是读取到字符串。 假设读取到的对象为line, 先用line.strip()和line.split()两个函数来给对象line瘦身和分割,就能得到我们想要的字符串列表了。
list_str = []for line in f.readlines() line_str = line.strip().split() list_str = list_str.append(line_str)
4、如果想返回一个numpy类型数组,只需要加一句
return numpy.array(list_str)
^^^这里的strip()函数是用来去掉空格回车的,参数称为删除序列。 在有参数rm的情况下,line.strip(rm)表示删除掉line从前、后开始数,位于删除序列rm中的字符;在参数为空的情况下,默认删除空白字符(包括‘ ’,‘\t', '\n', '\r')。这里要特别注意删除的顺序,是从头尾两端开始删除,一旦遇到不在删除序列中的字符,就会停止向中间检索。
^^^这里的split()函数是用来分割的,在有参数的情况下,line.split(str)表示以字符str为界限分割line, 如果有两个参数,line.split(str,N)表示以字符str为界限分割line N次;在参数为空的情况下,默认删除空白字符,如上。
总结:这是常用的数据处理中的文本读取方法,希望能熟练掌握!
- Python文本读取笔记
- Python学习笔记(28)-Python读取word文本
- 笔记文本读取
- python读取ppt文本内容
- Python迭代器,一行一行读取文本
- python 读取文本进行处理
- python读取文本中的坐标
- python 读取txt中文文本
- python读取中文txt文本
- 使用python读取txt文本
- python读取文本中的内容
- Python 文本挖掘:数据存储和读取
- python入门笔记-文本读写
- Python笔记-文本字符串格式化
- 文本读取方式一 练习笔记
- python网络爬虫文档读取-纯文本读取
- selenium+python自动化中 读取文本属性值和读取文本值
- 读取文本
- 分布式memcache 一致性哈希算法(采用环状数据结构)
- 第六节:判断与循环
- Android 运行时请求权限
- 我的音乐播放器。
- sublime及插件安装
- Python文本读取笔记
- Spring boot运行时添加定时任务
- loadrunner录制websocket
- npm安装
- 数学——洛谷 P2312 解方程
- java.lang.IllegalStateException: Failed to load ApplicationContext
- jQuery 判断元素是否在数组内、
- Vue.js v-for的简单demo
- [COM] 基于OLE的可视化拖放操作: drag & drop、IDropSource、IDataObject、IDropTarget