Python支持中文汉字编码经验总结
来源:互联网 发布:mac下安装php开发环境 编辑:程序博客网 时间:2024/05/16 18:34
source: http://xufive.blog.163.com/blog/static/172326168201092461958839/
每次处理汉字,总要出现一些意外。最容易出现的问题有:
- 从输入对话框获取的包含汉字的字符串,写入数据库后再读出来,变成乱码。
- 从文件对话框中获取的文件路径,不能被处理文件的模块接受。
- 使用Inno打包程序,不能使用中文路径。
Python中的字符串有str和unicode两种形式,两者之间不能连接,也不能比较。汉字编码,常见的有gbk和utf-8等形式,gb2312/cp936和gbk基本上是重合的。我曾经以为,utf-8编码之后就是unicode类型的字符串,结果导致概念不清,错误不断。事实上,gbk和utf-8编码之后,都是str类型的字符串,字符串前面加上u生成的才是unicode类型的字符串。gbk字符串、utf-8字符串和unicode字符串是可以相互转换的,其关系如下图所示:
至于如何确认一个字符串是哪一种类型的变量,则是一个很简单的问题:可以使用type()来检查字符串类型。例如:
- Python支持中文汉字编码经验总结
- Python汉字编码经验总结
- Python汉字编码经验总结
- python汉字编码
- python汉字编码
- python 汉字编码
- python支持中文
- python 支持中文
- python支持中文注释
- python支持中文
- Python支持中文
- python如何支持中文
- python支持中文
- Python matplotlib支持中文
- python汉字编码的问题
- python文件支持中文注释
- eclipse中python支持中文
- python中支持中文方法
- 在JS中访问JSP Request中的变量
- EXTJs 表单控件
- MyEclipse maven 只能从本地库找添加依赖的jar问题解决
- Razor模块的一些说明
- 关于MVC里的TempData与ViewData
- Python支持中文汉字编码经验总结
- C#中Split用法-字符串分割
- Windows 8 下sql server express 2005安装
- csapp2e 家庭作业 2.76
- 浅谈网站路径分析
- C#如何设置session过期时间
- Asp.net 里的cookies的使用
- Asp.net MVC部署(针对MVC3.0)
- 实现自己的ORM(反射以及Attribute在ORM中的应用)