python去掉 unicode 字符串前面的 u
来源:互联网 发布:英雄无敌3末日之刃mac 编辑:程序博客网 时间:2024/05/16 00:56
有时我们会碰到类似下面这样的 unicode 字符串:
u'\xe4\xbd\xa0\xe5\xa5\xbd'
这明显不是一个正确的 unicode 字符串,可能是在哪个地方转码转错了。
我们要想得到正确的 unicode 字符串首先就必须先将这个字符串转成非 unicode 字符串, 然后再进行解码。按照普通的办法进行 encode 肯定是不行的,因为这不是一个正确的 unicode 字符串:
In [1]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')Out[1]: '\xc3\xa4\xc2\xbd\xc2\xa0\xc3\xa5\xc2\xa5\xc2\xbd'In [2]: print u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')盲陆聽氓楼陆那如何才能得到我们想要的 \xe4\xbd\xa0\xe5\xa5\xbd 呢?python 提供了一个特殊的编码( raw_unicode_escape )用来处理这种情况:In [4]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape')Out[4]: '\xe4\xbd\xa0\xe5\xa5\xbd'In [5]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape').decode('utf8')Out[5]: u'\u4f60\u597d'In [7]: print u'\u4f60\u597d'你好
阅读全文
0 0
- python去掉 unicode 字符串前面的 u
- python字符串前面加u,r,b的含义
- python字符串前面加u,r,b的含义
- python字符串前面加u,r,b的含义
- python字符串前面加u,r,b的含义
- python print 打印unicode string的时候 去掉u' remove u'
- Python将'\u'开头的字符串转为unicode编码
- java-去掉字符串前面的零
- 去掉字符串前面的空格trimmed()
- 如何去掉字符串前面的0
- js 去掉字符串前面的0
- ORACLE去掉字符串前面的数值
- python中unicode字符串前缀u
- 飘逸的python - 编码杂症之在字符串前面加u
- Python中国在字符串前面加u,r,b的含义
- python 将反斜杠u \u字符串转为unicode/utf8
- python的u'字符串"(字符编码):字符串前有u,表示字符串以unicode格式存储
- Python中文编码问题(字符串前面加'u')
- jquery+ajax渲染,简单的拼接字符串
- Wannafly挑战赛2 B-travel spfa思路
- 解释器模式
- hdu 2236 无题II
- jsoup教程004-从一个URL加载一个Document
- python去掉 unicode 字符串前面的 u
- 普通广播与本地广播
- 基于python 编写的萤火虫算法(GSO)
- JavaScript学习笔记-04this绑定
- Java 反射机制获取Class中的方法 和字段
- 在网狐荣耀版添加房卡游戏时,经常有网友遇到进房卡房间弹出到大厅登录界面
- 新领域,新开始
- 关于js声明提前
- 网狐荣耀版微信登录没有反应失败的解决办法