python中文字串处理中的陷阱

来源:互联网 发布:查看端口是否被占用 编辑:程序博客网 时间:2024/06/11 17:07


python中的中文处理真是步步惊心啊,这次遇到的是在中文字串中查找字串的坑。


一个字串明明不包含某中文字符“治”,但用find却能找到,一切源于gbk和utf-8这类变长编码,如果要想使用字符串的各类操作,比如find、rstrip、split,必须先把编码转为unicode编码,再操作,如:


s = 'python中文坑真多's = unicode(s, 'utf-8')print s.find(u'坑')


0 0
原创粉丝点击