scrapy shell 爬取一些网站不响应
来源:互联网 发布:jdbc连接数据库 编辑:程序博客网 时间:2024/06/05 20:04
在爬去京东某商品网页时,如https://search.jd.com/Search?keyword=%E6%83%A0%E6%99%AE&enc=utf-8&suggest=1.his.0.0&wq=&pvid=d66c3ae3039d42b09f015585015ef653 实际上用 https://search.jd.com/Search?keyword=惠普&enc=utf-8 也可以
但是在scrapy shell 里始终无响应,仔细观察,你会发现有从定向的的现象,因此我们要解决的从定向问题(个人认为原因是出在这个地方)
在scrapy.Request中,我们知道可以通过设置参数来阻止重定向
from scrapy import RequestRequest("https://search.jd.com/Search?keyword=惠普&enc=utf-8",meta = {'dont_redirect': True})
{
区分scrapy的Request对象
python 的第三方库 requests模块
pip install requests
import requestshtml = requests.get(url, headers=headers, allow_redirects=False)
}
回来
那么如何在shell里实现
scrapy shell
from scrapy import Request
response=Request("https://search.jd.com/Search?keyword=惠普&enc=utf-8",meta = { 'dont_redirect': True})
re = fetch(response)
阅读全文
0 0
- scrapy shell 爬取一些网站不响应
- scrapy爬取电影网站
- scrapy(一)爬取动态网站
- scrapy框架爬取校花网站
- scrapy+xpath爬取不可描述网站
- python+scrapy+mysql爬取故事网站
- python scrapy之爬取 zhengfu网站
- 用Python 的 Scrapy 爬取 网站
- scrapy 爬取网站并存入数据库实例
- Scrapy爬取makepolo网站数据深入详解
- 使用scrapy爬取网站上的所有图片
- scrapy框架爬取校花网站的升级版
- 用scrapy爬取网站数据,以api方式
- 分别用selenium和scrapy爬取网站(一)
- 分别用selenium和scrapy爬取网站(二)
- 使用Scrapy爬取一个网站的数据
- scrapy-redis分布式爬取彩票网站信息
- Scrapy 通过代理(Proxy)爬取外部网站
- HDU 4393 Throw nails(技巧性模拟)
- POSIX和System V的比较/IPC函数汇总
- Android 二次封装网络加载框架
- 四、枚举,递推、迭代法初步学习
- 选择文件与获取选中文件绝对路径
- scrapy shell 爬取一些网站不响应
- idea中导入maven项目时修改maven地址
- LeetCode——Linked List Cycle
- C语言“翻译”C++结构体中的成员函数
- Leetcode:226. Invert Binary Tree
- tps(第三人称射击游戏) 1.相机
- Vue 使用过程中的问题记录
- Java(32):哈希表 的原理和应用
- Android深入--Handler机制简析(Handler、Looper、MessageQueue)