python中文处理
来源:互联网 发布:中国保险网络大学网址 编辑:程序博客网 时间:2024/05/01 12:20
python中文处理好方法
(转载URL:http://www.pythonid.com/bbs/viewthread.php?tid=20&extra=page%3D1)
(转载URL:http://www.pythonid.com/bbs/viewthread.php?tid=20&extra=page%3D1)
用python处理字符串很容易,但是在处理中文的时候需要注意一些问题。
比如:
a = "我们是python爱好者"
print a[0]
只能输出“我”字的前半部分,要想输出整个的我字还需要
b = a[0:2]
print b
才行,很不方便,并且当一段文本中同时有中英文的时候很难处理。
最好的办法就是转换为unicode。
像这样:
c = unicode(a, "gb2312")
print c[0]
这个时候c的下标对应的就是每一字,不再是字节,并且通过 len(c) 就可以获得字数!
还可以很方便的转换为其他编码,比如转换为 utf-8
d = c.encode("utf-8")
比如:
a = "我们是python爱好者"
print a[0]
只能输出“我”字的前半部分,要想输出整个的我字还需要
b = a[0:2]
print b
才行,很不方便,并且当一段文本中同时有中英文的时候很难处理。
最好的办法就是转换为unicode。
像这样:
c = unicode(a, "gb2312")
print c[0]
这个时候c的下标对应的就是每一字,不再是字节,并且通过 len(c) 就可以获得字数!
还可以很方便的转换为其他编码,比如转换为 utf-8
d = c.encode("utf-8")
- python中文处理
- python中文字符串处理
- Python的中文处理
- ZZ python处理中文
- [转贴]:Python中文处理
- python中文处理
- Python的中文处理
- python处理中文字符
- python中文处理
- Python:中文处理小结
- Python:中文处理攻略
- Python处理中文路径
- python中文处理
- Python的中文处理
- python 处理中文Excel
- Python处理中文
- Python 中文处理
- Python的中文处理
- 实习杂记
- UltraEdit的python语法高亮显示
- 访徐昊:论证李商隐是Gay 的咨询师
- 替换重复出现字符串 php
- 访“IT柏拉图”:让全世界都看到中国开源CMS!
- python中文处理
- eclipse中内存溢出的问题
- 访郝培强:两周精通Python的技术达人
- 常用的 Linux 镜像(广州电信)
- 【看“赢在中国”】聪明的人VS智慧的人
- 成功将EIE升级为SQLSERVER2005
- 浏览器状态码的含义
- 访李会军:程序员的床头应当放哪两本书
- Apache SOAP在 tomcat下安装