python编码方式
来源:互联网 发布:matlab简单编程实例pdf 编辑:程序博客网 时间:2024/06/09 16:30
查看编码方式:
import chardetprint chardet.detect(str) #str为string[字节序]若写入时以mode='a',encoding='utf-16'方式执行,则会在内容写入前添加标志:‘xff/xfe’
若以(mode='wb',encoding='utf-16')方式执行,则不会添加:‘xff/xfe’
若以(mode='a',encoding='utf-16-le')方式执行,则不会添加标志
读出时该部分被解码为'ufeff'
update_txt_encoding = {'confidence': 1.0, 'encoding': 'UTF-16LE'}#write encoding:utf-16update_write_encoding_le = {'confidence': 1.0, 'encoding': 'ascii'}#write encoding:utf-16-leprint "utf-16"+"*"*40utf_16_encoding = u'时间'.encode('utf-16')print [utf_16_encoding]#['\xff\xfe\xf6e\xf4\x95']print [utf_16_encoding.decode('utf-16')]#[u'\u65f6\u95f4']print [utf_16_encoding.decode('utf-16-le')]#[u'\ufeff\u65f6\u95f4']print utf_16_encoding.decode("utf-16") == utf_16_encoding.decode("utf-16-le")#Falseprint "utf-16-le"+"*"*40utf_16_le_encoding = u"时间".encode('utf-16-le')print [utf_16_le_encoding]#['\xf6e\xf4\x95']print [utf_16_le_encoding.decode("utf-16")]#[u'\u65f6\u95f4']print [utf_16_le_encoding.decode("utf-16-le")]#[u'\u65f6\u95f4']print utf_16_le_encoding.decode("utf-16") == utf_16_le_encoding.decode("utf-16-le")#True
1、由update.txt写入update_history.txt中时,遍历出update中所有词并以mode=‘a’,encoding='utf-16'的方式写入,write()写入时,若参数为unicode,则需对参数进行encode操作。而‘utf-16’编码会在内容写入前添加‘xff\xfe’标志
例:[u'时间'.encode('utf-16')]==>['\xff\xfe\xf6e\xf4\x95']
2、由代码生成update.txt文件时,mode='wb',encoding='utf-16',以’wb‘写入时,不会在文件前添加’\xff\xfe‘
问题:怎样使不断添加的文件不会出现‘\xff\fe’?
该问题解决方法:先判断该文件是否不存在,若不存在则使用(mode='wb',encoding=’utf-16‘),若存在则使用(mode='a',endocing='utf-16-le')。不存在时若用(mode='a',endocing='utf-16-le')方式,会因为ascii而产生乱码补充:文件读写操作
内置的open()方法打开文件时,read()读取的是str,读取后需要使用正确的编码格式进行decode()。write()写入时,如果参数是unicode,则需要使用你希望写入的编码进行encode(),如果是其他编码格式的str,则需要先用该str的编码进行decode(),转成unicode后再使用写入的编码进行encode()。如果直接将unicode作为参数传入write()方法,Python将先使用源代码文件声明的字符编码进行编码然后写入。
0 0
- python 编码方式总结
- python编码方式
- python编码方式
- Python中的编码方式
- python编码方式
- python 编码方式总结
- python修改编码方式
- python中的文件编码方式
- Python 查看网页编码方式
- python 修改默认编码方式
- python string的编码方式
- 改变python输出流的编码方式
- python自动化获取网页编码方式
- Python编码方式以及改变方法
- 判断网页的编码方式 python
- 设置python页面的编码方式(windows)
- python学习笔记(七):编码方式
- python unicode 及解码编码方式简介
- FFmpeg:播放音频
- Python安装、配置图文详解
- css固定表头
- RedHat samba服务器搭建
- 1057. Stack (30)
- python编码方式
- 构建自己的思维导图
- linux下音视频采集套rtmp服务
- [转载]R语言中的机器学习(转)
- Android设置Dialog透明度、黑暗度方法
- 关于Android布局的应用
- padding,盒子与文字之间的距离。
- Maven学习笔记二:设置HTTP代理
- perl 文件处理