python读取文本文档处理不可见字符

来源：互联网发布：希捷媒体同步软件编辑：程序博客网时间：2024/05/29 17:49

某些软件，如notepad，在保存一个以UTF-8编码的文件时，会在文件开始的地方插入三个不可见的字符（0xEF 0xBB 0xBF，即BOM）。

因此我们在读取时需要自己去掉这些字符，python中的codecs module定义了这个常量：

# coding=gbkimport codecsdata = open("Test.txt").read()if data[:3] == codecs.BOM_UTF8:data = data[3:]print data.decode("utf-8")

//---------------------------------

通用格式：

#coding:utf-8import codecsfile_path=unicode(r'路径','utf-8')  #路径中包含中文的话，需要使用unicode进行处理nation_dict=open(file_path,'r').read()#打开文件，并且读入，变成字符串if nation_dict[:3]==codecs.BOM_UTF8:   #处理不可见字符，关键用到codecs包，    nation_dict=nation_dict[3:]

引用于：http://www.jb51.net/article/26543.htm

0 0

python读取文本文档处理不可见字符
linux 文本中的不可见字符和处理
Python过滤不可见字符
sql server 不可见字符处理总结
SQL Server 不可见字符处理
【Sqlserver】SQL Server 不可见字符处理
python 读取文本进行处理
常用不可见字符
不可见字符
注意不可见的字符！
oracle中的不可见字符
eclipse显示不可见字符
linux 不可见字符查看
notepad 显示不可见字符
shell 替换不可见字符^@
python网络爬虫文档读取-纯文本读取
Unity3d读取文本文档中文不显示的问题
小心不可见字符组成的不可见字符串
DLL 的编写，引用，导出 .
如何比较mysql数据库结构的不同？
iOS多线程-- dispatch源
Android开发之实现透明的颜色效果
特征选择与特征权重计算的区别
python读取文本文档处理不可见字符
android 属性android:visibility
android学习笔记(3)---QQ登陆界面
神奇“3分钟”让你活得更久
微笑于明媚红尘
舌尖上的中国II
robotium+TMTS混合使用，ant构建成html测试报告
Openstack基本命令
vim中进行spell检查