python-快速使用urllib爬取网页(8-URLError)
来源:互联网 发布:华为硬件单片机笔试题 编辑:程序博客网 时间:2024/06/05 15:29
程序的执行难免遇到异常,发生异常不要紧,关键是要合理处理异常
在Python爬虫中,经常要处理与URL相关的异常
使用URL异常处理-URLError类进行处理
导入urllib.error模块
本节我们主要介绍两个类:URLError + HTTPError
import urllib.requestimport urllib.errortry: urllib.request.urlopen("http://blog.csdn.net")except urllib.error.URLError as e: print(e.code) print(e.reason)
运行上述代码,出现403错误
产生URLError错误的原因:
a、连不上服务器
b、远程URL不存在
c、无网络
d、出发了HTTPError
上面例子就是触犯了HTTPError所导致
403是状态码
我们来总结一下各种状态码的含义
200 OK 一切正常
301 Moved Permanently 重定向到新的URL,永久性
302 Found 重定向到临时的URL,非永久性
304 Not Modified 请求的资源未更新
400 Bad Request 非法请求
401 Unauthorized 请求未经授期
403 Forfidden 禁止访问
404 Not Found 没有找到对应的页面
500 Internal Server Error 服务器内部出现错误
501 Not Implemented 服务器不支持实现请求所需要的功能
阅读全文
0 0
- python-快速使用urllib爬取网页(8-URLError)
- python-快速使用urllib爬取网页(1)
- python-快速使用urllib爬取网页(4-GET)
- python-快速使用urllib爬取网页(5-POST)
- python-快速使用urllib爬取网页(6-代理服务器)
- python-快速使用urllib爬取网页(7-DebugLog)
- python-快速使用urllib爬取网页(小结)
- python-快速使用urllib爬取网页(2-Headers属性)
- python-快速使用urllib爬取网页(3-超时异常)
- 01爬虫---快速使用Urllib爬取网页
- python urllib爬取网页编码问题
- Python爬虫实例(4)-用urllib、re和正则表达式爬取网页图片
- python 使用selenium+urllib爬取淘宝MM照片
- 使用selenium等待网页加载完成,lxml解析网页,利用urllib爬取图片
- python urllib, urllib2实现登陆和简单爬取网页(个人坑点笔记)
- Python报错: urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED]
- Python urllib 爬取基金数据
- python用urllib爬取百度
- Couldn't import dot_parser, loading of dot files will not be possible.
- MySQL —— 约束
- Mybatis入门一
- 网易面试 合唱团
- 1205: 杨八方的英语问题
- python-快速使用urllib爬取网页(8-URLError)
- 蓝桥杯: 入门训练 A+B问题
- Android------视频播放器(包含全屏播放,快退,快进,腾讯新闻的列表播放等)
- 移动端开发工具比较(JAVA Object-c /Cordova Ionic / Recent Native)
- 1.数据结构与算法绪论
- 图像平均操作为什么能降噪
- scrapy爬知乎返回500
- centos 7.0 firewalld防火墙常用操作
- 《单核工作法图解》阅读笔记