爬虫第一天(1)

来源:互联网 发布:淘宝一千零一夜男主角 编辑:程序博客网 时间:2024/05/17 04:21
import urllib2  # 发请求的模块base_url = 'http://www.baidu.com/' #定义url#执行urlopen方法,传入一个URL,返回一个response对象response = urllib2.urlopen(base_url,timeout=60)  #data:有数据传送是post请求,没有则是get;timeout:请求超时设置html = response.read() #response对象的read方法,可以返回获取到的网页内容。print htmlprint response.info() #获取响应头print response.getcode() #获取响应状态码print response.geturl() # 最终响应html的url
原创粉丝点击