八爪鱼采集器︱加载更多、再显示20条图文教程(Xpatth、Ajax)
来源:互联网 发布:网络直播的发展历程 编辑:程序博客网 时间:2024/05/16 09:35
每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~
———————————————————————————
由于代码布置采集器比较麻烦,又很早知道八爪鱼采集器的强大,所以把一些常规的采集内容贴成图文教程,供以后使用。
八爪鱼采集器官方视频教程见:http://www.bazhuayu.com/tutorial/zxs.aspx?t=0
采集流程:
1、打开网页
2、寻找“加载更多”、“在显示20条”的Xpath的路径
3、设置循环、Ajax
4、循环-提取内容
5、内容正则化
6、布置采集
注意是:先循环完列表,然后再提取数据。
——————————————————————————————
1、打开网页
打开网页部分,就是你自己想要的网页。
——————————————————————————————
2、寻找“加载更多”、“在显示20条”的Xpath的路径
官方认为火狐浏览器,加载一些插件就可以了。
在附加组件里面。需要加载两个插件:firebug、firePath。自己搜索一下,就能下载得到。
右键:“使用Firebug查看元素”,
点击“FirePath”
点击原页面的“加载页面”,Xpath就会显示出来了。
——————————————————————————————
3、设置循环、Ajax
然后填写在“单个元素“里面,如果上面出现字样——”加载更多“,那么就代表这个步骤设置成功。
同时,拖拽一个点击元素在里面,并在”高级选项“设置两个步骤:
勾选“使用循环”;
勾选Ajax加载,设置2s。
——————————————————————————————
4、循环-提取内容
这个步骤,跟常规的设置一样。
直接点击元素——创建一个元素列表以处理一组元素——添加列表——继续编辑列表——再点击——添加到列表——创建列表完成——循环
同时注意的是:如果是加载更多、再显示的问题,不能放在上述的循环之上,要放在之下。
5、提取数据——正则化
提取数据的时候,会出现需要只选择一部分,需要选择:
格式化数据-添加步骤,然后进行步骤的选择。
——————————————————————————————
最终的流程表:
每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~
———————————————————————————
- 八爪鱼采集器︱加载更多、再显示20条图文教程(Xpatth、Ajax)
- 火车头采集图文教程
- 八爪鱼采集:赶集网电话号码采集图文教程
- UITableView加载更多显示
- ajax 点击加载更多,出现后面的内容,一次加载十条内容
- c# ajax 实现手机网站“加载更多..."
- thinkphp+ajax+jquery异步实现加载更多
- ajax手机端滑动加载更多
- PHP+ajax实现连接数据库、加载更多
- Swiper ajax 左右切换,下拉加载更多
- Spring MVC Ajax请求加载更多
- jq ajax 点击按钮异步加载更多
- phpcms ajax列表分页加载更多
- jquery weui ajax滚动加载更多
- 【Jfinal】页面滚动 ajax 加载更多
- PHP+ajax实现连接数据库、加载更多
- Ajax 实现点击按钮加载更多
- thinkphp+ajax 实现点击加载更多数据
- 物理内存和虚拟内存
- JS 通过表单向 Action 传递元素
- 内核模式下的字符串操作
- API:RedisTemplate<K,V>
- UVA 12105 Bigger is Better(数位dp)
- 八爪鱼采集器︱加载更多、再显示20条图文教程(Xpatth、Ajax)
- iphone/ipad前端开发技巧
- 欢迎使用CSDN-markdown编辑器
- js局部变量与全局变量和php局部变量与全局变量
- Day41: empty day
- notification中的图标
- IOS 10 权限声明及国际化
- 新版 Primavera P6 乱码问题
- Android Studio如何导入第三方主题