str字符和unicode字符的区别
来源:互联网 发布:sis001最新域名 编辑:程序博客网 时间:2024/05/21 09:02
实际情况是,beautifulsoup处理后的网页,的确是utf-8的。而utf-8和unicode,本身就不相等。
首先,字符串分两种,一种是str字符,一种是unicode字符。str字符,就是普通字符,某种编码的字符,包括ANSI,GBK,UTF-8等,而Unicode就是原始的unicode,未经过encode编码的unicode,而进过某种编码,比如utf-8,gbk等编码后的unicode,就是对应str类型了。
Python中,不论是Python 2.x还是Python 3.x中,总体上说,字符都只有2大类:
一类是通用的Unicode字符,原始字符;
另一类是,(unicode被编码后的),某种编码类型的字符,比如UTF-8,GBK等等类型的字符;
其中,需要注意对应的Python文件所使用的编码,需要和其声明的编码(UTF-8)一致。
换句话说,你要把代码保存到UTF-8编码的Python文件中。
1、文件编辑器设定的编码 ==文件申明编码;2、str原始字符要转码成指定unicode编码;
3、采集后的信息编码(如html文件编码为gb2312)要和1文件编码(如utf-8)一致
4、程序文件编码要和本地电脑的编码一致,如gbk
转摘和更详细:
https://www.crifan.com/summary_python_string_encoding_decoding_difference_and_comparation_python_2_x_str_unicode_vs_python_3_x_bytes_str/
阅读全文
0 0
- str字符和unicode字符的区别
- unicode 和 str(Python字符编码解码)
- ANSI字符和UNICODE字符的转换
- utf-8和unicode的区别:字符编码的辨析
- unicode和ASCII两种字符环境的区别
- 字符编码中ASCII、Unicode和UTF-8的区别
- 字符编码中ASCII、Unicode和UTF-8的区别
- 【字符编码】ASCII、Unicode和UTF-8的区别
- 字符编码笔记:ASCII,Unicode 和 UTF-8 的区别
- Python中字符编码的总结和对比:Python 2.x的str和unicode vs Python 3.x的bytes和str
- ANSI字符和UNICODE字符
- 了解python中bytes,str和unicode的区别
- unicode字符和多字节字符的相互转换接口
- 字符编码ANSI和Unicode的比较
- UNICODE字符串和ANSI字符的转换
- 中文和unicode字符的相互转换
- ANSI和UNICODE字符的相互转化
- 字符串 和 Unicode字符 的互转
- 麦科捷发布eXtremeDB v.7.1 新版本提供更快更灵活的安全保证
- Java工程师学习线路
- 你觉得自己喜欢写代码吗?
- JAVA课程学习七:带格式字符串反转
- 分布式锁服务的关键技术和常见解决方案
- str字符和unicode字符的区别
- MyCollector01---Scheduler
- 校门外的树 线段树版
- IntelliJ IDEA Spring Boot学习(4) 集成mybatis
- 看懂java设计模式类图
- Linux命令(压缩,解压Zip)
- 工厂模式
- 2017-10-27
- KMP算法C++实现