网络爬虫抓包的使用

来源：互联网发布：淘宝中老年装编辑：程序博客网时间：2024/06/06 03:50

本文为原创博客，仅供技术学习使用。未经允许，禁止将其复制下来上传到百度文库等平台。如有转载请注明本文博客的地址(链接)。

网络爬虫的第一步就是分析要爬取的数据的类型，这要通过抓包完成。在浏览器里的页面发生的数据通信，只需要打开Chrome的开发者工具，切换到network选项卡就够了。

举个例子，比如要爬取东方财富网的板块数据，链接为http://quote.eastmoney.com/center/BKList.html#trade_0_0?sortRule=0
这里写图片描述

1、打开Chrome的开发者工具。
这里写图片描述

2、在这个界面里，我们重点看Name下面的一列，显示的是这个网页发出的所有请求。你可以按F5刷新下整个页面，这一列会出现更多请求。
这里写图片描述

3、然后在Name下面的一列，开始一个一个找存储真实数据的Response，找到之后对应的Headers中会有真实的URL地址。

这里写图片描述

阅读全文

0 0