python读取文本文档处理不可见字符
来源:互联网 发布:希捷媒体同步软件 编辑:程序博客网 时间:2024/05/29 17:49
某些软件,如notepad,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。
因此我们在读取时需要自己去掉这些字符,python中的codecs module定义了这个常量:
# coding=gbkimport codecsdata = open("Test.txt").read()if data[:3] == codecs.BOM_UTF8:data = data[3:]print data.decode("utf-8")
//---------------------------------
通用格式:
#coding:utf-8import codecsfile_path=unicode(r'路径','utf-8') #路径中包含中文的话,需要使用unicode进行处理nation_dict=open(file_path,'r').read()#打开文件,并且读入,变成字符串if nation_dict[:3]==codecs.BOM_UTF8: #处理不可见字符,关键用到codecs包, nation_dict=nation_dict[3:]
引用于:http://www.jb51.net/article/26543.htm
0 0
- python读取文本文档处理不可见字符
- linux 文本中的不可见字符和处理
- Python过滤不可见字符
- sql server 不可见字符处理 总结
- SQL Server 不可见字符处理
- 【Sqlserver】SQL Server 不可见字符处理
- python 读取文本进行处理
- 常用不可见字符
- 不可见字符
- 注意不可见的字符!
- oracle中的不可见字符
- eclipse显示不可见字符
- linux 不可见字符查看
- notepad 显示不可见字符
- shell 替换不可见字符^@
- python网络爬虫文档读取-纯文本读取
- Unity3d读取文本文档中文不显示的问题
- 小心不可见字符组成的不可见字符串
- DLL 的编写,引用,导出 .
- 如何比较mysql数据库结构的不同?
- iOS多线程-- dispatch源
- Android开发之实现透明的颜色效果
- 特征选择与特征权重计算的区别
- python读取文本文档处理不可见字符
- android 属性android:visibility
- android学习笔记(3)---QQ登陆界面
- 神奇“3分钟”让你活得更久
- 微笑于明媚红尘
- 舌尖上的中国II
- robotium+TMTS混合使用,ant构建成html测试报告
- Openstack基本命令
- vim中进行spell检查