对编写爬虫的巩固

来源:互联网 发布:木马源码 编辑:程序博客网 时间:2024/06/10 03:28

本次实现的目的:

完成对国际现货与期货石油价格、美元人民币汇率、美元指数等数据的实时监控,采样频率为一小时一次。

1.寻找可以提取数据的网址

首先找到一个网页显示美元人民币汇率,找到其url,利用分析浏览器抓包工具可以找到这些数据相应的js页面,如下:


2.分析并提取数据

分析我们需要的数据,如美元人名币汇率,其中第二项代表目前的汇率,后面代表前几次刷新的汇率,美元指数、原油指数分析方法与其类似。找到我们需要的数据后,用正则表达式提取出来。

3.存入数据库

加入循环,每小时刷新一次,将数据存入数据库。




0 0
原创粉丝点击