程序博客网 > 网络服务器机柜厂家

Scrapy中的数据流过程展示

来源：互联网发布：网络服务器机柜厂家编辑：程序博客网时间：2024/06/09 11:11

Scrapy中的数据流由执行引擎控制，其过程如下:

引擎打开一个网站(open a domain)，找到处理该网站的Spider并向该spider请求第一个要爬取的URL(s)。
引擎从Spider中获取到第一个要爬取的URL并在调度器(Scheduler)以Request调度。
引擎向调度器请求下一个要爬取的URL。
调度器返回下一个要爬取的URL给引擎，引擎将URL通过下载中间件(请求(request)方向)转发给下载器(Downloader)。
一旦页面下载完毕，下载器生成一个该页面的Response，并将其通过下载中间件(返回(response)方向)发送给引擎。
引擎从下载器中接收到Response并通过Spider中间件(输入方向)发送给Spider处理。
Spider处理Response并返回爬取到的Item及(跟进的)新的Request给引擎。
引擎将(Spider返回的)爬取到的Item给Item Pipeline，将(Spider返回的)Request给调度器。
(从第二步)重复直到调度器中没有更多地request，引擎关闭该网站。

阅读全文

0 0

网络服务器机柜厂家

网络服务器机柜厂家

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子湿疹该怎么办宝宝身上湿疹怎么办做手术查出梅毒怎么办小孩子不吃青菜怎么办吃鸡蛋糕房怎么办人工流产后腰酸怎么办人工流产后腰疼怎么办人流腰痛怎么办流产腰酸背痛怎么办流产腰疼怎么办月子没坐好腰疼怎么办打胎后腰疼怎么办打胎后腰酸怎么办自然流产大出血怎么办小产后腰酸怎么办流产后腰酸怎么办动物检疫证明怎么办人工授精准生证怎么办成都准生证怎么办 207 江西省准生证怎么办网上怎么办准生证办完准生证以后怎么办农村准生证怎么办2017 墙面瓷砖不喜欢怎么办卫生间瓷砖滑怎么办瓷砖颜色不喜欢怎么办地板砖潮湿怎么办冬天地板砖凉怎么办地板砖有划痕怎么办玻化砖被划了怎么办瓷砖黑了怎么办玻化砖刮花了怎么办地砖有划痕怎么办塑胶跑道有毒怎么办塑胶跑道有味道怎么办盆底筛查不合格怎么办地坪漆不干怎么办卫生间地面不平怎么办新车气味大怎么办抽水机声音大怎么办钢化膜不粘了怎么办