防采集的有效方法
来源:互联网 发布:淘宝一分钱秒评 编辑:程序博客网 时间:2024/04/30 00:33
解决方法:在模板中多个关键位置加上类似这样的代码,如:
<td zzz="{$ArticleID}">文章内容</td>
注意zzz="{$ArticleID}"使用无效的HTML标签,这样浏览器就不显示,但采集时因为无法设置开始代码或结束代码,无法保存规则。
采集原理:很多采集程序都是逐步捉取而拿到想要的内容的,通常情况下是截取头部和尾部来获取中间一部分,当你的文章列表或者内容没有规则,采集程序找不到您的通用头部和尾部的时候,自然就采集不了,这样别人就很难截取头部和尾部,这个防采集方法正是利用了这一点来实现防采集的。
例子:这里举例防止内容页采集,下面为内容页片段代码,大家留意一下,里面多了代码“zzz="{$ArticleID}"”,这代码就是防止采集的代码。
源代码: 以下是引用片段: <table class=tablebig cellSpacing=0 cellPadding=0 width=770 align=center border=0>
<tr>
<td class=tdleft>
<table class=pv110tablefull cellSpacing=0 cellPadding=0 width="100%" border=0>
<tr>
<td vAlign=top>
<table cellSpacing=0 cellPadding=0 width="100%" border=0>
<tr>
<td class=pv110title colSpan=2 zzz="{$ArticleID}">{$ArticleTitle}</td>
</tr>
<tr>
<td class=pv110info colSpan=2 >{$ArticleInfo}</td>
</tr>
<tr zzz="{$ArticleID}">
<td class=pv110picontent colSpan=2 zzz="{$ArticleID}">
{$ArticleContent}</td>
</tr>
<tr zzz="{$ArticleID}">
<td zzz="{$ArticleID}" class=pv110info align=right width=888>{$ArticleAction}</td>
</tr>
</table>
<table cellSpacing=0 cellPadding=0 width="100%" border=0>
<tr>
<td width=16> </td>
<td width=754>{$PrevArticle}<BR>{$NextArticle}</td>
</tr>
</table>
</td>
</tr>
</table>
</td>
</tr>
</table>
如果之前已经建好的项目,现在重新采集,就会出现以下的错误信息:
错误信息产生错误的可能原因:
如果重新设置采集信息,采集回来就会有多余的代码,如图:
我们改进一下 :
源代码
以下是引用片段:
<table class=tablebig cellSpacing=0 cellPadding=0 width=770 align=center border=0>
<tr>
<td class=tdleft>
<table class=pv110tablefull cellSpacing=0 cellPadding=0 width="100%" border=0>
<tr>
<td vAlign=top>
<table cellSpacing=0 cellPadding=0 width="100%" border=0>
<tr>
<td class=pv110title colSpan=2 zzz="{$ArticleID}火影电气百科">{$ArticleTitle}</td>
</tr>
<tr>
<td class=pv110info colSpan=2 >{$ArticleInfo}</td>
</tr>
<tr zzz="{$ArticleID}火影电气百科">
<td class=pv110picontent colSpan=2 zzz="{$ArticleID}火影电气百科">
{$ArticleContent}</td>
</tr>
<tr zzz="{$ArticleID}火影电气百科">
<td zzz="{$ArticleID}火影电气百科" class=pv110info align=right width=888>{$ArticleAction}</td>
</tr>
</table>
<table cellSpacing=0 cellPadding=0 width="100%" border=0>
<tr>
<td width=16> </td>
<td width=754>{$PrevArticle}<BR>{$NextArticle}</td>
</tr>
</table>
</td>
</tr>
</table>
</td>
</tr>
</table>
采集回来后,有你站的网站名称,你还会采集吗!
注意:在模板中多个关键位置加上类似这样的代码。
<script type="text/javascript"><!--google_ad_client = "pub-4717125974896180";/* 728x90, 创建于 09-7-17 */google_ad_slot = "3536088218";google_ad_width = 728;google_ad_height = 90;// --></script><script src="http://pagead2.googlesyndication.com/pagead/show_ads.js" type="text/javascript"></script>- 防采集的有效方法
- 防网站采集非常有效的办法
- 防采集方法
- 9招有效防电脑辐射的方法
- 最有效的最新防360拦截方法大全!
- 一个有效防止数据采集的方法,哈哈哈
- 常见防网站数据采集策略方法和它的弊端及采集对策
- 常见防网站数据采集策略方法和它的弊端及采集对策
- 动易网站防采集方法
- 九招最有效防电脑辐射方法
- 最有效防电脑辐射方法
- 最有效防电脑辐射方法
- 最有效防电脑辐射方法
- 九招最有效防电脑辐射方法
- 九招最有效防电脑辐射方法
- 九招最有效防电脑辐射方法
- 采集与防采集
- 最简单有效的SQL防注入的两种方法
- 转载暴强贴:从.NET平台调用Win32 API
- 怎么样把“显示桌面”按钮找回来
- 关于alarm函数
- 最新版迅雷定时器下载2009-7-19
- 大公司的Java面试题集(关于Java中的注意事项)
- 防采集的有效方法
- interview
- IIS 5.0 & IIS 5.1开设站点的方法:
- FZU 1475 不同的单词
- 投入与奉献的准则
- LAMP apache php mysql 安装 配置
- IIS6开设站点的方法:
- 1211
- 如何做好芯片验证之我见(1)