scrapy爬取深度设置

来源：互联网发布：阿富汗帝国坟场知乎编辑：程序博客网时间：2024/06/06 18:39

通过在settings.py中设置DEPTH_LIMIT的值可以限制爬取深度，这个深度是与start_urls中定义url的相对值。也就是相对url的深度。例如定义url为：http://www.domz.com/game/,DEPTH_LIMIT=1那么限制爬取的只能是此url下一级的网页。深度大于设置值的将被ignore。

如图：

0 0

scrapy爬取深度设置
scrapy 设置爬取深度（七）
Scrapy爬虫(五)：有限爬取深度实例
爬虫实践---Scrapy-豆瓣电影影评&深度爬取
scrapy实战-爬取
Scrapy爬取图片
scrapy爬取图片
Scrapy爬取1
scrapy 爬取漫画
scrapy爬取图片
scrapy爬取链接
Scrapy爬取亚马逊商品信息
scrapy爬取博客文章
Scrapy爬取博客内容
scrapy实现分页爬取
Scrapy之图片爬取。
scrapy简单爬取内容
scrapy实现递归爬取
Floyd
4、确定对象在使用前已被初始化
如何通过函数调用得到n个要改变的值（摘抄自谭浩强C语言）
求哈夫曼树的带权路径长
Spring事务管理的两种模式
scrapy爬取深度设置
ORACLE常见数据类型详解
月挂西窗顿觉孤瘦梦入红楼倍感烟
相遇是缘
ubuntu上的fastdisk
JavaScript离开页面事件
身份验证（公开密钥加密原理简介）
oracle中char，varchar，VARCHAR2的区别
串口乱码