python3.x中urllib的使用
来源:互联网 发布:中国象棋算法python 编辑:程序博客网 时间:2024/05/16 13:44
2.x版本的python可以直接使用import urllib来进行操作,但是3.x版本的python使用的是import urllib.request来进行操作,下面是简单的例子:
===============================================================================
# get code of given URL as html text string
# Python3 uses urllib.request.urlopen()
# instead of Python2's urllib.urlopen() or urllib2.urlopen()
import urllib.request
fp = urllib.request.urlopen("http://www.python.org")
mybytes = fp.read()
# note that Python3 does not read the html code as string
# but as html code bytearray, convert to string with
mystr = mybytes.decode("utf8")
fp.close()
print(mystr)
================================================================================
# get the code of a given URL as html text string
# Python3 uses urllib.request.urlopen()
# get the encoding used first
# tested with Python 3.1 with the Editra IDE
import urllib.request
def extract(text, sub1, sub2):
"""
extract a substring from text between first
occurances of substrings sub1 and sub2
"""
return text.split(sub1, 1)[-1].split(sub2, 1)[0]
fp = urllib.request.urlopen("http://www.python.org")
mybytes = fp.read()
encoding = extract(str(mybytes).lower(), 'charset=', '"')
print('-'*50)
print( "Encoding type = %s" % encoding )
print('-'*50)
if encoding:
# note that Python3 does not read the html code as string
# but as html code bytearray, convert to string with
mystr = mybytes.decode(encoding)
print(mystr)
else:
print("Encoding type not found!")
fp.close()
转载地址:http://blog.csdn.net/zsuguangh/article/details/6226385
- python3.x中urllib的使用
- python3.x 中urllib的使用
- Python3 中urllib的使用
- python3.x 的urllib使用例子
- python3.x 的urllib使用例子
- python3.x 的urllib使用例子
- Python3中urllib.request.retrieve的使用
- python3中urllib库的使用
- python3.x中urllib和urllib2包的更新
- Python3中urllib使用介绍
- Python3: urllib.request 的使用
- Python3.x urllib
- python3.X使用urllib与2.X不同
- python3.x 和 python2.x关于 urllib的用法
- Python3.x中出现 "AttributeError: module 'urllib' has no attribute 'urlopen'" 的解决方法
- Python3中urllib的UnicodeDecodeError错误
- Python3中urllib的一点坑
- Python3学习笔记 urllib模块的使用
- 如何与陌生人搭讪十技巧
- Python os.path模块
- You cannot combine custom titles with other title features
- PL/SQL Developer启动时报错:“Control 'dxDockBrowserPanel' has no parent window"
- Android Tab使用总结
- python3.x中urllib的使用
- 字符转换
- sql server 分组统计数据
- Pro Oracle Database 11g RAC on Linux 读书笔记1
- 下载csv,excel文件名乱码的问题(IE和FireFox两种浏览器)
- sql优化-hint的作用
- DES
- Overview of IP Multimedia Subsystem (IMS) [LTE Self-training]
- Android 2.3时间 更新与同步