python编码获取
来源:互联网 发布:网络免费小说一号红人 编辑:程序博客网 时间:2024/06/06 18:55
不同的网站有不同的编码方式,同时,当我们从从服务器获取编码的编码可能跟网页中声明的编码又不一样,所有我们需要编写一个工具里来获取网页的编码方式
这里主要说明一个获取编码的小工具chardet
安装方式:pip install chardet (sudo)
使用chardet.detect()方法
“`
# -- coding: utf-8 --
import urllib
import chardet
url = ‘http://www.jd.com’
def getEncoding(url):
”’
@url:需要获取到的编码方式的链接:http://www.hao123.com
”’
html = urllib.urlopen(url)
data = html.read()
result = chardet.detect(data)
return result[‘encoding’]
def main():
print getEncoding(url)
if name == ‘main‘:
main()“`
0 0
- python编码获取
- python编码获取
- Python获取系统默认字符编码
- python自动化获取网页编码方式
- python获取和更改系统编码
- python 获取系统相关编码的函数
- 使用python获取网页编码格式
- python获取网页编码的方法
- python 获取文件字符编码类型
- python获取html编码GB2312中文乱码的问题
- [置顶] python CGI模块获取中文编码问题解决- 部分方案
- python爬虫获取编码时中文乱码问题
- python CGI模块获取中文编码问题解决- 部分方案
- python编码获取排列组合的全部情况数及Python内置函数获取排列组合
- 系统编码 python编码
- 【编码】Python编码
- PYTHON 编码
- python 编码
- 代码小白的开始 DASH
- 单选。多选,删除
- java 类File的方法: mkdir()方法与mkdirs()的区别
- 设计模式学习(十五)————状态模式
- 如何在CentOS6的apache上永久运行nodejs应用
- python编码获取
- c++内存空间分配与指针探讨
- 单选2
- 对提高班的认识
- Http 服务器
- 单选3
- 推荐谢源教授的报告@Architecture 2030 Workshop of ISCA2016
- 通过邮箱激活账号、找回密码
- 单选的布局