火车采集器分页细节

来源:互联网 发布:手机写剧本软件 编辑:程序博客网 时间:2024/04/28 14:14

循环记录:

选“添加为新记录”:则是每一个记录在数据库中以一行存储

 

1 全部列出所有分页

 

把分页包括在内即可。

2没有全部列出 上下页

 


分页是在网址没有全部列出时设置的,若网址设置了规则,可以全部列出(亚马逊、京东)

则可以不用设置分页

http://s.club.jd.com/productpage/p-971478-s-0-t-3-p-(*).html?callback=CommentListNew.setData



内容过滤是包含了<div 的数据就不采集,非采集下来,再把标签去掉。

 

替换可以将制定的字符或制定的标签内的字符替换成制定的字符(或者为空)

0 0
原创粉丝点击