python逐个遍历字符串(含汉字)
来源:互联网 发布:卖男生帽子的淘宝店铺 编辑:程序博客网 时间:2024/05/01 23:36
s = "中国china"for j in s: print j
首先一个,你这个’a’是什么编码?可能不是你所想的gbk
>>> a='中国'>>> a
这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明gbk。
另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。
接下来是遍历问题。
linux的shell大都默认是utf-8,所以一个中文字符是三个字,所以要三个三个地读,你可以试下:
>>> a[:3]
出来就是个”中”字
windows的command的默认是cp936,也就是gbk,一个中文字符是两个字,所以两个字两个字地读(a[:2])。
还有另一种遍历的方法,把字符串转换成unicode,这样中文英文都是一个字,就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,英文字母只占一个字。
s = u"中国china"for j in s: print j
输出如下:
中国china
1 0
- python逐个遍历字符串(含汉字)
- php逐个汉字遍历字符串
- 逐个字符读字符串
- 字符串逐个字符取出
- python字符串只保留汉字
- VC里面如何拆分含汉字与字母的字符串
- Oracle 获取字符串中所有中文汉字(含标点符号)
- java中逐个输出字符串
- Python Cookbook 第二版 汉化版 [Recipe 1.1] 逐个处理字符串中的各个字符
- Python Cookbook 第二版 汉化版 [Recipe 1.1] 逐个处理字符串中的各个字符
- Python遍历文件,正则选取汉字便于多语言支持
- C#逐个取一串字符串的字符
- getchar从字符串逐个读取字符
- 拆解字符串并逐个处理 R语言
- OJ.0056.字符串比较,逐个比
- 判断一个含汉字的字符串的所占的字节数(汉字占两个字节)
- 根据汉字获取它的字符串拼音首字母(大写),含多音字
- 根据汉字获取它的字符串拼音首字母(大写),含多音字
- sdk帮助文档使用技巧
- 虚拟机增加磁盘空间
- 简单的反U盘病毒(删除不了的畸形文件夹)
- ssh公私钥配置
- java基本数据类型
- python逐个遍历字符串(含汉字)
- 使用maven下载jar包慢优化
- VC++动态链接库(DLL)编程深入浅出(zz)
- STM32的SYSTICK详解
- 1087. All Roads Lead to Rome (30)
- 代理模式例子
- SSM,Spring,SpringMVC,Mybatis之Service---29
- 负载均衡方案
- iic系列问题