用scrapy写爬虫 显示 Filtered offsite request to 错误.

来源:互联网 发布:单簧管 知乎 编辑:程序博客网 时间:2024/06/06 00:23

爬电源网公司信息,无法爬取。
查看控制台发现报如下错误:
DEBUG: Filtered offsite request to ‘product.dianyuan.com’:
这里写图片描述
果断上网百度 ,找到答案 。

官方对这个的解释,是你要request的地址和allow_domain里面的冲突,从而被过滤掉。可以停用过滤功能。
yield Request(url, callback=self.parse_item, dont_filter=True)

阅读全文
0 0