seo教程

来源:互联网 发布:中国工业企业数据 编辑:程序博客网 时间:2024/05/17 23:35

 

搜索引擎(SE)工作原理

搜索引擎释放网络蜘蛛 spider,spider 先检查开放目录DMOZ
上登录网站网址进行访问,并根据收录的网站的外部链接找到更多的
网站(外连接,对于二级域名spider 等同于外部连接。)根据网站的
的更新频率及权重级别,安排spider 的搜索频率。对于新站,google
进入sandbox 处理。

对于站内的连接(内连接),(google)根据网站的pr 值,计算出
搜索深度,检查收入的页面中获取的的网址是否更新,有则收录新的网
址,无则关闭spider。Baidu 及yahoo 则根据自己的算法,收录访问
深度内的网址。
2、搜索引擎读取 spider 收集的网址库,按照网址收录优先规
则,调度爬虫crawler。Google 对于提交了sitemap 的网站,抓取
深层次的页面。
3、搜索引擎释放 crawler 抓取网址页面
4、收录网站为中文网站根据分词技术进行关键字索引,按照
页面的权重进行排位。
5、进行反作弊 spam kill 和dance(google)

谁要做SEO

互联网站点,均需要做SEO。SEO 即不是作弊,也不是一门学
科,只是搜索引擎衍生出来的行业,是普通人可以掌握的简单的互联
网站应用的技巧。做SEO,不需要支付任何费用,不存在高深的知识,
不存在垄断性,也不是不道德的行为,根本不需要昧着良心说话。

为什么要做SEO

做SEO,早期的目的让搜索引擎更容易对你的站点进行识别和
收录,同时相应的关键字排位靠前,让你的客户更容易找到你的网站
和你的产品,增加你的产品和公司的曝光率,是适应搜索经济发展的
必经之路。完整的SEO 还是对用户心理需求分析,适应浏览者需求
的过程。

什么是SEO

SEO (Search Engine Optimisation),顾名思义就是搜索引
擎优化。SEO 是通过研究各类搜索引擎如何抓取互联网页面和文
件,及研究搜索引擎进行排序的规则,来对网页进行相关的优化,
使其有更多的内容被搜索引擎收录,并针对不同的关键字获得搜索
引擎的左边更高的排名,从而提高网站访问量,最终提升网站的销
售能力及宣传效果。
SEO 不是技术手段,是网站推广的一部分,是主推被动式营销。
SEO 是针对网络的传播模式,把目标内容(广告、产品、品牌)传
递给目标授众的最有效的途径。

网站流量分析

网站流量统计分析是网站运营和维护的基础工作。在分析访问数据的基础上对网站内容及营销策略进行调整,以期获得更好的营销效果,是进行流量分析的最终目的。获取网站访问统计资料通常有两种方法:一种是通过在自己的网站服务器端安装统计分析软件来进行网站流量监测;另一种是采用第三方提供的网站流量分析服务。
对SEO来说,流量分析中有两个重要统计指标:访问来源(Referrer)和搜索使用的关键词,即用户通过哪些链接进入自己的网站,以及通过哪些关键词找到自己。这些链接可能是各大搜索引擎,可能是某些导入链接,也可能就是你发布在某网站上的文章的URL;而关键词分析则可以了解哪些关键词及组合能带来访问量。这样就对网站的链接及关键词需要强化和弱化的方面了如指掌。
网站访问数据分析对SEO的指导是多方面的。但由于市面上大部分流量统计软件目前仅停留在统计数据的罗列上,缺乏对营销指导的结论性报告,因此这些模式化的分析结果实际上只是半成品,还需要网络营销专业人士对这些原始数据进行深度剖析,其对于SEO的指导作用才能真正发挥出来。

Google Dance

Google有8个数据中心,共享超过一万台的服务器。一般在每月中下旬开始升级数据库。这期间,新的网站被加入,无效网站被删除,对收录网站进行全面深度检索,也可能在这期间调整算法。由于每次升级都会引起很多网站排名波动,俗称Google Dance。有人则直接把Google Dance定义成Google重新安排它的搜索结果排名的过程。
Google Dance对于SEO来说,涉及的注意事项如下:
1、 网站的提交及更新时间
在Dance期间,新网站被收录的机会增大,因此宜在Dance其间提交新网站及加大网站更新力度

2、 静观其变,及时跟进
由于数据调整有一个过程,Dance期间的普遍表现是排名波动不稳定,忽上忽下。也可能在这期间调整排名算法。宜在Dance结束后,针对排名升降结果和竞争对手的排名情况调整自己的SEO策略。

网站数据更新

网站经营者都希望发布的重要内容如新产品信息或重要新闻被蜘蛛快速抓取并出现在搜索结果中。但现今我们点击搜索结果中的链接,往往进入后发现内容与结果描述不同,这是因为搜索到的结果是搜索蜘蛛在上次光顾该网站时抓取到的信息,之后该页内容更新,蜘蛛程序却还没有来得及抓取,从而造成的搜索结果与实际内容不符。不过,各搜索引擎都在加快
对网站访问的频率,除了每月一次全面的深度检索,还对频繁更新的网站进行数天甚至每天简单检索一次,以保证搜索结果的时效性。总结起来,Google对网站信息的更新取决于以下因素:
1、网站自身的更新频率
一个长期没有更新的网站,无论是用户和蜘蛛程序都会减少对它的访问。可以说,更新越频繁,蜘蛛程序光顾越多,你的新信息出现在搜索结果首页的机会也越大,被抓取到的网页数量也越多。
2、网站的结构 如果一个网站拥有优化的结构,蜘蛛访问起来很顺利的话,那么它会更乐意访问该网站。
3、服务器的性能 如果蜘蛛程序前来索引你的网站,而你的服务器迟迟不能加载页面,或根本不能访问,那么搜索引擎就会尝试在下一次更新时再来,如果多次出现同样的情况,搜索引擎就会减少对该站的访问,或将它在数据库里删除。
4、PR值的高低 正如高PR值拥有了获得高排名的优势,很多业内人士认为PR值的高低同样是搜索引擎判断更新频次的重要因素。
5、Meta“revisit-after” 有人在Meta中如下设置:<META NAME=”revisit-after” CONTENT=”5 days”>,以次提示蜘蛛程序每5天访问一次。实际上,由于Google基本上已经将Meta所起的作用降到很低,因此类似标签是没有多大作用的。但是,如果将时间设为30天以后的数值,被认为是有效的。
综上所述,网站维护得力,才是搜索引擎经常更新网站数据的根本原因。

Google沙盒效应(Sandbox Effect)

关于Google沙盒现象,业界众说纷纭。基本上可以这样理解:这是Google对于那些刚发布不久就有良好排名的“可疑”站点置于某种屏蔽程序中进行一段时期的“隔离审查”。待网站表现稳定之后,再解除屏蔽,给予其应得的实际排名和PR值。这段时长可能延续3个月左右。
之所以出现沙盒现象,主要是Google针对过度进行SEO——尤其采用了作弊手段如“制造”大量导入链接而获得高排名的网站采取的防备措施。因此,如果你的网站在发布不久后以核心关键词在Google排名中出现由高走低的不稳定现象,多半是被Google请进了沙盒。
当然,还有一种观点认为:Google为了在搜索结果(SERP)中为用户提供更多新信息,往往给予新发布的网站更多“关照”,使得新网站暂时获得排名优势;但随着Google数据更新不断加快,这种对新网站的照顾开始解除,于是该网站排名趋向正常。
无论原因怎样,对待沙盒效应,正确的态度和方法是:保持冷静,当排名在短时间内迅速上升时不应盲目乐观,因为这是不稳定的表现。应该利用这个有利时机,频繁更新网站内容,提高内容质量,获得更多高质量导入链接,增加网站访问量,才能将排名优势一直保持下去

PR值的作用

由于网页级别的高低直接受链接的影响,而链接仅是SEO的一个方面,因此PR的高低只能反映出SEO的部分效果。一个网页如果拥有高PR值能够说明的仅是:
网页比较重要,拥有了排名靠前的优先权,并不能与排名靠前直接划上等号
具有了获得高质量导入链接的谈判优势
 搜索引擎会加快对网页数据的更新
看上去挺美
正因为具有了排名靠前的优先权和谈判优势,使得高PR网站往往最终确实产生高排名,业内不少人士就干脆直接将PR与SEO划等号,这不仅不正确,也不利于SEO实施。因为PR值不高的网站同样有可能获得好的排名,而PR高的不见得有理想的排名。并且,在这样的思想指导下,人们往往片面追求链接效应,忽略了SEO对于内容、结构、关键词等方面的分析和改进,而后者才是用户和搜索引擎长期关注的焦点。网络营销专家冯英健博士认为:PR值的高低应该是包括SEO在内的搜索引擎营销所产生的自然结果而不应作为追求的目标。
结论:在SEO的过程中,不能忘记内容建设,不能忘记优质外链,但忘掉PR可没什么大不了的。

影响PR值的因素

PR值体现为从0到10的11个数值,在Google的工具栏上以一条横向绿色柱状图显示,0级情况下呈白色。它是针对网页而不是网站,因此一个网站的首页和内页往往有着迥然不同的PR值。由于Google市场拓展进程的原因,中文网页的PR值整体上低于英文网页。对中文网站来说,拥有3级PR是基础, 4级PR算达标,5级PR可谓良好,而6、7级PR就算相当优秀的网站。当然,由于PR最直接的影响因素是来自链接,因此这种评级并不代表内容的级别水准,网站内容质量对PR的影响是间接的、长期的。根据PR值的算法原理,可知影响一个网站(首页)PR值的因素主要包括:
1、 网站的导入链接质量:
根据前文对高质量导入链接的分析,则获得高PR值需要获得来自以下网站的链接:

加入搜索引擎分类目录

与已经加入目录的网站交换链接
获得来自PR值不低于4并与你的主题相关或互补的网站的链接
你的链接出现在流量大、知名度高、频繁更新的重要网站上(如新闻源)
与你交换链接的网站具有很少导出链接
 与内容质量高的网站链接(PR值上升潜力大)

2、 导出链接数量:
根据PR计算原理,由于“一个网页的重要性被平均的传递到它所引用的网页”,因此反过来看,一个页面内过多的导出链接将潜在引起该页PR值的流失。但从内容的角度看,适当数量的与主题有关联的导出链接给搜索引擎带来良好的印象。因此,一个页面,尤其是首页的导出链接数量的把握,应该兼顾到PR值和关键词内容二者之间的平衡,即控制导出链接数量,以不超过10个为宜。
3、 搜索引擎收录一个网站的页面数量
在探讨SEO的时候,人们过多关注核心关键词排名以及首页的表现情况,却往往忽略了一个极其重要的问题:即搜索引擎对一个网站收录的页面数量。后者在SEO中也有着极其重要的意义。一个用核心关键词查询排名不佳的网站,可能由于被抓取大量网页而在用户使用其它关键词查询时,内页获得前三甲排名。由于用户搜索时使用的关键词具有分散性,使得这种情况往往给网站带来极大访问量。
正因为收录页面的数量直接影响访问量,因此对PR值的影响也是很大的。被收录页面越多,主页PR越高。不过需要强调的是,此处所指的数量是指被收录数与网站页面总数的比值,而不是收录页面的绝对数值。比如一个拥有50个页面的网站被收录了10个页面,网站的被收录比值是1/5,一个拥有5000个页面的网站被收录了500个页面,比值是1/10,结果是收录10个页面比收录500个页面的网站还更具排名优势。但对各个搜索引擎来说,究竟达到多大的比值算是良好,目前还没有相关的数据。

4、首页PR的高低
尽管对PR的界定是针对网页而不是网站,但由于每个网页都依托某一网站而存在,首页是推广的核心页面,所以网站首页PR高低对内页各PR也产生直接影响。一般而言,一个网站各页面的PR值呈现以下走向:首页﹥一级页面﹥二级页面﹥三级页面……每深入一级,PR降低1-2个档次。更深层次可能就无法列入评级范围了。当然,如果一个深层内页有很多外部或内部链接,情况则另当别论。
5、文件类型
Google可以索引到的网页和文件类型包括:pdf、asp、jsp、hdml、shtml、xml、cfm、doc、xls、ppt、rtf、wks、lwp、wri、swf。做成PDF格式的文件往往都是网站比较重要的内容或文章。因此Google默认PDF格式文件的PR天生为3,高于一般HTML文件。

同理,Google给予XML、PS、Word、Power Point、Excel等类型页面的PR也比普通网页文件高。因此,对于网站比较有价值的内容,建议做成PDF格式。
6、 PR值的更新:
Google 每个月进行一次彻底的数据更新(Dance),更新后的网站排名和导入链接都会有某些变化,但其PR更新时间一般要延迟至dance后三个月左右,而且网站的PR值相对稳定,要上升或下降一级PR是很不容易的事情。

原创粉丝点击