爬虫(连续动作让爬虫持续采集数据)

来源:互联网 发布:天津网络微信投票公司 编辑:程序博客网 时间:2024/06/06 19:36

连续动作让爬虫持续采集数据

(转载自:http://www.gooseeker.com/doc/article-141-1.html)

连续动作介绍

规划采集流程-详细版

连续动作执行说明

连续动作的相关概念

连续动作原理:无需规定怎样循环,自动执行连续动作

连续动作的按钮介绍

连续动作前和连续动作后的主题名

用xpath定位到动作施加点

连续动作的额外延时

连续动作的必做动作

连续动作的模拟点击

连续动作的重复次数

连续动作的内容表达式

连续动作的合用表达式

以下拉菜单被选择项的值为例说明结果文件解析

应用场景(一)

应用场景描述:鼠标浮动抓取弹窗信息

连续动作实战:连续移动鼠标采集微博浮窗个人信息

加载以前定义的抓浮窗信息的规则

应用场景(二)

应用场景描述:连续滚屏抓取瀑布流网页

应用场景(三)

应用场景描述:自动输入查询条件抓取微信公众号

连续动作实战:自动输入查询条件抓取微信公众号

实战

怎样抓取中国知网CNKI数据

自动点击京东商品属性采集价格

注:仅保存以供之后爬虫学习。