Scrapy性能调优及检测性能问题的步骤
来源:互联网 发布:正知正见正思维 编辑:程序博客网 时间:2024/04/30 05:38
前面已经说过,Scrapy的瓶颈被设置在下载器这个地方。要获得最高的性能,可以从一个低的CONCURRENT_REQUESTS
开始,一直增加这个值,直到达到了以下某个限制:
- CPU使用率达到80-90%
- 目标网站的延迟显著上升
- scraper(即爬虫和pipeline)中的所有
Response
对象占用的总内存大小不超过5MB
同时还要保证以下条件:
- 在任何时候都要保证调度器的队列(mqs/dqs)中有一些
Request
,以保证下载器中的请求数量 - 永远不要使用阻塞的代码或者CPU密集型的代码(这种情况下应该使用另一个线程处理)
上图总结了诊断并修复Scrapy性能问题的步骤。
0 0
- Scrapy性能调优及检测性能问题的步骤
- 性能调优的步骤
- 性能检测及调优tips
- Websphere性能调优的基本步骤
- 【Scrapy爬虫系列2】性能调优
- 快速定位隐蔽的sql性能问题及调优
- 性能问题定位及调优
- Android性能优化——性能问题及性能调优方式
- android性能优化总纲——性能问题及性能调优方式(一)
- 性能优化系列总篇--性能问题及性能调优方式
- 性能分析原则及步骤
- 性能测试步骤及分析
- 基于排序及性能检测
- 性能测试的步骤
- 性能测试的步骤
- apache的性能检测
- C++的性能检测
- 气动阀的性能检测
- Http、TCP/IP协议与Socket
- iOS 的 APP 如何适应 iPhone 5s/6/6Plus 三种屏幕的尺寸?
- 关于C语言程序条件编译的简单使用方法
- office转pdf(在线预览)思路(java示例)
- 将gradle更好应用到你的应用开发上面
- Scrapy性能调优及检测性能问题的步骤
- JSTL-核心标签库
- oracle使用exp导出时不导出空表解决方法
- CVPR2014结果
- 关于链接的一些理解
- iPhone屏幕尺寸、分辨率及适配
- R语言数据分析视频免费大放送
- network启动不了故障排除
- IO学习(一)认识流,文本文件,二进制文件