Unicode和UTF8
来源:互联网 发布:阿里云centos安装lamp 编辑:程序博客网 时间:2024/05/08 06:25
对于初学者,可以简单地这么理解(实际并不准确):
Unicode是一个字符集,它将(各种语言的)一个字符映射为整数。
UTF-8是一种编码方式,它将Unicode字符集(字节序列)编码和解码。
在python中,当我们决定要使用Unicode字符集时,请保证:
- 程序中出现字符串时一定要加个前缀 u
- 不要用 str()函数,用unicode()代替
- 不要用过时的 string 模块 – 如果传给它的是非ASCII 字符,它会把一切搞砸。
- 不到必须时不要在你的程序里面编解码 Unicode字符.只在你要写入文件或数据库或者网络时,才调用encode()函数;相应地,只在你需要把数据读回来的时候才调用decode()函数.
原则就是:
程序运行时,数据需使用unicode字符集;保存数据到文件或数据库时,需使用utf8
有一点非常重要:
在以utf-8方式读取文件的时候,请确保你的文件编码格式也是utf-8.
Ref
http://stackoverflow.com/questions/643694/utf-8-vs-unicode/643713#643713
《Python核心编程》第二版 P199
0 0
- 转码utf8 - unicode 和 unicode - utf8
- Unicode,Ansi和UTF8
- UTF8 、unicode 和 Ascii2
- utf8 和unicode关系
- Unicode和UTF8
- 读写Unicode和UTF8格式文件
- Gb2312和Utf8 转为 Unicode
- unicode和utf8的关系
- unicode和utf8编码详解
- unicode和utf8的区别
- PHP unicode解码 和 utf8与unicode
- UTF8和UNICODE和GBK编码
- unicode&utf8
- UTF8/Unicode
- 关于UNICODE转化成UTF8和POST
- 关于unicode和utf8,utf16等
- ANSI、UNICODE和UTF8之间字符转换
- unicode和utf8编码的互相转换
- 杂记
- hive学习总结(7)—hive性能调优
- Mac 开机自启动配置设置方法(定时任务解决方案)
- HDU 5698
- mysql优化
- Unicode和UTF8
- 中文分词之Java实现使用IK Analyzer实现
- Android 4.4 UI体验之ImmersiveMode沉浸模式-android
- 源码分析Android触摸事件处理机制
- 深入理解Java中的流
- CxfWebservice 工具集作用
- 架构设计:负载均衡层设计方案(5)——LVS单节点安装
- Codevs5230【三校联考试题】 猴子(重庆一中高2018级信息学竞赛测验8) 解题报告
- 线程同步实现