python中文单字符处理
来源:互联网 发布:网络直播需要什么设备 编辑:程序博客网 时间:2024/06/05 14:49
之前没怎么用python处理中文数据,今天遇到一个问题,记一下。
如果
x = u'中文文本'
那么x是unicode字符串,
x[0] = '中'
如果x是从文本读的,比如
x = codecs.open("test.txt").readlines()[0]
那么x不是unicode字符串,
x[0:3] = '中'
也就是3个字符才是一个中文单字
我们可以用isinstance(x,unicode)来检查x是否是unicode,如果不是,可以用y=unicode(x, 'utf8')转成unicode,字符集根据实际test.txt的编码进行调整。
转换以后 y[0] = '中'
0 0
- python中文单字符处理
- python处理中文字符
- Python处理中文字符
- 中文字符处理 python
- python处理中文字符
- Python中文字符处理解决方案
- python处理中文字符的一点经验
- python处理mysql中文字符长度
- python re 处理中文字符的问题
- python json.dumps处理中文字符
- Python CGi URL 中文以及特殊转义字符的处理
- Python对中文字符的处理(utf-8/ gbk/ unicode)
- python处理csv文件名中中文字符解决方法
- 中文字符处理
- MYSQL中文字符处理
- 中文字符处理
- C++处理中文字符
- c++ 中文字符处理
- 盈鹏飞嵌入式---【IMX6UL开发板试用体验】上手试用与资源使用
- lintcode-线段树
- Android 启动引导页面的实现
- C/C++ 混合编译之extern C的使用
- 实现Comparator接口为什么不用实现Equals方法
- python中文单字符处理
- GDB Quick Guide
- MATLAB图像压缩编码
- 浅析Android如何编译生成apk
- 新IT运维时代 | Docker运维之最佳实践-上篇
- LVDS开发指南
- LeetCode之路:476. Nubmer Complement
- 大规模相似数据搜索
- 图像分割之图割工具箱GCO3.0的使用(二)