揭秘百度是如何判断原创的
来源:互联网 发布:如何在手机淘宝付钱 编辑:程序博客网 时间:2024/04/29 15:00
谈谈判断原创的几种方式,欢迎拍砖。
站长平台关于百度如何判断原创的描述是这样的:
首先,通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合;
其次,对原创候选集合,通过作者、发布时间、链接指向、用户评论、作者和站点的历史原创情况、转发轨迹等上百种因素来识别判断出原创网页;
最后,通过价值分析系统判断该原创内容的价值高低进而适当的指导最终排序。
百度如何判断内容相似,是根据上下文意思,根据所表达的中心思想,还是文字的相似。
如果是根据表达的主题,那很多内容,不同的人所写,内容不同,但是主题相同,是不是也被当成相似呢;
如果是文字的相似,那传说中,将原先内容,通过自己的话,再写一次,是不是就成了原创呢;
如果是上下文,那对文章重新组合,再替换关键词,例如许多伪原创工具,是不是也很独特呢?
当然,任何一种算法,都会考虑,N种可能,Q猪的观点,任何一种原创,都必须要有自己独特的观点在里面,要有自己独特的视角,一篇文章中,属于本人的原创观点,要占最重要的位置。
判断原创的几个重要步骤
判断原创,有几个比较重要的因素。
a、作者、发布时间
分析:网络上大部分抄袭的、复制的内容,作者都是改过的,不是原文作者。还有发布时间,互联网上数以亿计的网页内容,搜索引擎不可能实时监控所有的网站,爬完所有的内容,精确记录文章发布的时间。
所以这两因素不是很靠谱,当然很多网站,特别是博客,有显示发布时间,但是,这也不能太当真,是吧。
b、链接指向
分析:其实,对于做网络优化SEO的人员来说,做好网站内部的链接,是一项最基本的工具。
你写一篇文章,在提到一个内容的时候,比如说到网络结构优化,然后就将链接链接做向前面写过的文章:如何制作合理的网站结构。如果文章中讲到石榴算法,那就直接连向:石榴算法,百度对低质量页面说不。
在一篇文章中,拥有很完善的链接体系,也是作为原创文章的一个判断标准,至少说明对文章内容很用心。
c、用户评论
分析:用户评论可以丰富文章的内容,对用户具有更强的引导性和参考性,搜索引擎的目的是为用户提供检索服务,引到用户,进入最有价值的网页中。
一篇文章有大量的评论,在一定程度上也说明了文章的受欢迎程度,在后面的排序中可以获得好的排名。
d、作者和站点的历史原创情况、转发轨迹
分析:这个判断原创的出发点,就是考虑出身,试想一下,网站中,绝大部分的内容都是采集、复制、转载而来的,那么对于这个网站内的其他内容,在判断原创时,就会被打上不信任的标签。
综合上面的观点,网站内容需要坚持原创、鼓励用户评论、明确作者、发布时间,同时,更重要的一点,所有内容无论是原创还是转载,都坚持标明原出处,这是为网站在搜索引擎内赢得信任投票。
更多精彩信息尽在小蚂蚁站长吧http://www.xiaomayi88.com/seo/seojichu/186.html
- 揭秘百度是如何判断原创的
- 太原网络营销师揭秘百度竞价(SEM)如何判断关键词的好坏?
- 百度原创性内容判断的失误
- 百度搜索引擎对原创的判断标准
- 【揭秘】庄家是如何猎杀散户的
- 揭秘 | Google是如何“腐蚀”学术界的?
- 谈搜索引擎是如何判断文章是否原创
- 百度如何识别原创
- 看百度如何判断原创内容 谈谈原创项目那点事
- 【百度地图API】如何判断点击的是地图还是覆盖物?
- SEO(搜索引擎优化)百度鼓励原创,那么如何判断呢,百度原创识别“起源”算法与星火计划
- 搜索引擎是如何区分原创的
- 揭秘Google是如何做代码审查的
- 原创 判断程序的执行环境是VM收藏
- 如何判断百度蜘蛛的真假
- 如何避免百度误判网站原创的内容
- 百度的“知心搜索”揭秘
- 百度眼中的原创
- 经典数据结构--双向链表
- 华蓥丰镇1383751584986
- Socket编程指南及示例程序
- 以下是网上找到一些关于excel操作的资源可通过链接查看http://www.soaspx.com/dotnet/csharp/csharp_20091125_1762.html
- 信阳赤峰1383751626705
- 揭秘百度是如何判断原创的
- android笔记 AIDL 实现进程间通信
- oracle rownum使用与分页
- 软件开发-理论性知识(四)
- 花1K内存实现高效I/O的RandomAccessFile类
- Linux中select函数学习及实例笔记
- TCP协议连接建立时3次握手的过程4次结束连接
- 搜索引擎通过什么方法识别网站本地特性
- 弹出div后面窗口变灰