python 读取utf-16时缺少字节的处理

来源:互联网 发布:软件自学网 下载 编辑:程序博客网 时间:2024/06/10 23:52
utf16' codec can't decode byte 0x0a in position truncated data

这个错误是什么意思,是什么原因造成的
这个python错误的意思是,decode("utf-16") 这个操作,碰到了一个单个字节的回车(0x0A),utf-16中每个字符应该是2个字节,如果是UTF-16大端,就是 00 0A,如果是UTF-16 小端(也叫UCS-2小端)的编码就是0A 00。
这个错误就是在UTF-16 小端的情况下,少了后半个字符


即图中红色字符所指的位置,有个0A,它后面缺少了00,解决方法是在decode时,用 decode("utf-16","ignore") 即加上ignore这个选项,把这个错误忽略掉。
0 0
原创粉丝点击