利用Http Analyzer与RCurl抓取脚本中隐藏的数据

来源:互联网 发布:cnki是什么数据库 编辑:程序博客网 时间:2024/05/16 17:56

转载请注明出处啊喂!

http://write.blog.csdn.net/postedit/38684445


续上文【用HTTP analyzer找出网页脚本不可见的信息】http://blog.csdn.net/jansii/article/details/38123071


将xls中的"https://hq.sinajs.cn/?_=0.8689907682128251&list=gb_msft"

复制到浏览器地址栏,enter发现是打不开的,果然加密了。


今天研究腾讯财经中的恒生指数http://stock.qq.com/hkHSI

发现脚本中有以下部分


点进去一看⊙﹏⊙赫然就是恒生实时数据,当天时间对应恒生指数以及交易量。

一看URL,并没有https?

现在数据都不怎么需要加密吗?

于是受到启发,把前面谷歌数据网址的s去掉,在浏览器上尝试,可以了……

用R抓抓看


没什么问题!终于拿下!再用字符串处理一下即可。

注意到后面是goog,那换成别的行吗?查一下微软的编号是MSFT

改成MSFT,跑跑看


不错,甚满意~~


0 0
原创粉丝点击