SEO知识(总结土著游民)(3)

来源:互联网 发布:linux java 启动脚本 编辑:程序博客网 时间:2024/05/17 06:44

轻松几步获得上万点击率(八)内链的优化

在网页链接优化中,首先我们要清楚一个概念:什么是“锚文本”。首先我们来看下面的一行代码。

<a href="http://www.baidu.com/" target="_blank">百度搜索引擎</a>

在上面的这一行代码中,http://www.baidu.com/是链接目标页,而“百度搜索引擎”这几个字,就是链接的锚文本。

锚文本是对目标链接页面的一个文字性的形容。例如上面的这行代码中,“百度搜索引擎”就是对于http://www.baidu.com/"的一个内容形容。

当然,锚文本的作用并不止是对于链接方面的,还包括了图片的ALT标签。例如我们在网页上有一张图片,是郭德纲的照片。如果没有ALT标签的话,搜索引擎是不会知道这张照片上是什么内容的,但是如果我们加入了ALT标签,效果就不一样了,当我们在搜索引擎的图片搜索中再搜索郭德纲这个关键词的时候,我们就可以找到老郭的这张照片。

这一节我们主要来讲一下对于网页内容中链接的锚文本优化,对于ALT和图片的标签在以后我们讨论。

我们在SEO优化的过程中往往会忽视一个问题,那就是对于内部链接的优化。在任何互联网的网页中,作为一个网站,肯定是由多个网页链接在一起的。因此对于内链的优化显得尤为重要。

有些时候,我们可以看到有些网站中的内链是以以下几种方式去做的。

1  直接使用链接地址,例如:“希望了解详情,请点击my.html

2  使用相对链接地址,例如<a href=”../my.html”>关于我们</a>

3  使用默认文字:例如<a href=”../my.html”>点击这里</a>

4  使用大段的话<a href=”../my.html”>如果你想了解更多的信息,请您直接点击这个地方。</a>

以上的这些都是在没有经过搜索引擎优化之前所犯的经常性错误。实际上,对于锚文字的优化,我们只需要稍加注意即可。下面以一个正确的例子来说明

 

<a href=”http://www.baidu.com/about.html”>关于百度</a>

 

从上面这个例子中我们看到,我们在对内链做优化的时候,其实只要使用绝对链接,然后再加上能够形容目标页的内容,这就可以了。需要避免的是,我们不能让锚文本成为一大段话,也不能使用CSS来隐藏链接。

 

这里需要注意以下的几个方面

 

1              底部关键词锚文本可能会招致惩罚。在前文中我们提到,优化手段中有一个方面是可以在页脚加一个关键词的锚文本,这样会对搜索引擎优化有比较大的帮助。但是问题在于,如果对于新手来说,这个地方的优化是非常敏感的,一不小心就会被惩罚。因此,我个人建议在没有熟练操作SEO之前,这样的办法还是不做。

2              如果在一篇文章中有一个关键词可以链向目标网页,那么只要使用一次即可。这句话比较难理解,举个简单的例子,加入我们现在有一个关键词是“轴承”,而这个“轴承”是可以链接到相关的特定页面。我看过很多朋友,为了优化内链,“轴承”这个词在文章中出现几次就加几次链接,其实这样是不对的。因为过度的内链会导致你的权重分散,甚至成为优化过度。因此千万记得只要在第一个词上加上链接就好了。

3              指向首页的链接并没有太大的好处。有朋友认为,假如我的网站关键词是“轴承”,那么凡是网页内容中的“轴承”二字我们都应该加上指向首页的链接,这样就可以优化的很好。其实事实并不是这样,这也是优化过度的一个方面。因此,我们需要注意的是,指向首页的链接我们没必要过度关注锚文字,而内页之间的链接我们优化好锚文字就好了。


轻松几步获得上万点击率(九)图片优化

Google和百度都有自己的图片搜索系统。而我们在百度搜索风云榜中的“十大美女”“十大帅哥”“十大景点”这些也都是直接链接到百度图片搜索的。下面的图我们可以看出每天有多少人在搜索这些热门图片。

 

 

 

1-13

 

1-14

怎么样,看到这么多的搜索量是不是有些心动?别着急,现在我们就开始一起讨论一下图片搜索引擎的优化。

前面我们说过,搜索引擎是不认识或者不知道你的图片上是什么内容的。尽管现在有些搜索引擎提出了一种利用色谱、色阶等方式进行图片索引,但是大部分图片搜索引擎还是需要从网页内容去判断图片的内容的。

因此,我们在做图片搜索引擎优化的时候,需要注意以下的几个方面的问题。

1、图片需要有ALT标签标示图片的内容:如果没有ALT标签的话,图片是什么内容搜索引擎是不会知道的。这个问题在前面已经有提到过,因此不做重复。但是这里有一个问题,ALT到底如何命名才是最好的呢?

一般情况下,搜索引擎判断图片内容有下面几种组合:

A:认为图片和关键词有依据的证明是ALT

B:认为图片和关键词相似的依据是页面titleALT

C:认为图片属于高质量高匹配的依据是TITLE+ALT+KEYWORDS

 

 因此,为了让我们的图片在搜索引擎有一个好的排名,ALT不应该直接是keyword,或者直接是title,而是和他们两者有相关性的相关词。

2、图片的命名:所谓图片的命名是指图片的文件名。这一点在搜索引擎的排名中也占有一定的比重,一般图片命名为关键词的排名要比图片命名随机的排名要高。

3、图片周围文字:这里所谓的图片周围并不是我们视觉上的图片周围,而是代码中图片前后紧邻的文字内容。这个文字内容对于图片的内容形容是一个很重要的因素,因此搜索引擎也会分析图片周围的文字内容是什么。

 

因此,我们做图片搜索引擎优化,应该是注意一下的几个方面

 

1图片ALT的命名不能和keywordstitle完全一样,但是可以包含keywordstitle。三个因素中的相关度越高,图片排名越高。

2如果要单独做图片搜索引擎,那么最好是单独图片单独网页。不要一张网页上面多个图片。

3图片周围的描述文字很重要,要尽量贴近图片内容。

4尽管这里有很多地方体现图片的内容,但是也要注意页面的关键词密度、关键词分布等问题。

这里有一个小技巧:在任何搜索引擎的索引中,对于图片权重的排序如下jpg>jpeg>gif>png>bmp

 

也就是说,JPG的图片格式搜索引擎中的排名是最好的,也是得到权重最高的,因此推荐使用。

 

而在百度搜索引擎中,图片大小的权重排序为

桌面>新闻图>大图片>小图片

 

也就是说,桌面图片的权重是最高的。

轻松几步获得上万点击率(十)网页减肥

为了让搜索引擎更青睐我们的网站,我们需要在设计的时候就考虑到一件事——网页减肥。所谓的网页减肥,就是指将我们网页的代码缩减,让实质的文字性内容增加,从而提高网页的信噪比。

对于搜索引擎来说,除了元标签中的代码搜索引擎蜘蛛会了解之外,其他的代码例如CSSJavaScript等都会对搜索引擎抓取页面内容产生一定的阻碍。在网页文件中,搜索引擎蜘蛛爬行所需要找到的第一个内容就是meta内容,如果有大量的CSS代码、JavaScript代码,就会导致搜索引擎蜘蛛用很大的功夫都难以找到,这样对于搜索引擎的不友好,会导致搜索引擎对网页本身的评分降低,因而导致排名也很低。因此,我们在设计的时候,需要将这些因素做出适当的修改。具体如下。

 

对于CSS代码的减肥。

例如下面一段代码

<style type="text/css">

<!--

body,td,th {

       font-family: Arial, Helvetica, sans-serif;

       font-size: 14px;

       color: #003366;

}

-->

</style>

 

上面这段代码,已经是对于网页文件的一个减肥,因为设置整体CSS代码就可以不必在每段文字都设置样式,这样就是减少代码量的一个手段

另外,将CSS文件另存为其他的文件,利用<link rel="Stylesheet" type="text/css" href="../css/styles.css" />的形式去调用,也是一种网页减肥的办法。

 

 

对于JavaScript代码的减肥。

对于使用了JavaScript技术的网页来说,从页面一开始就有大量的JavaScript代码。这和刚才提到的CSS代码一样,同样不利于搜索引擎抓取页面。因此,对于这一块的优化有两个方面。

第一、   脚本内容放到页面的最后。

把大部分、甚至全部的JavaScript代码放置在页面的尾部。这样不但不会影响到JavaScript代码的作用,而且可以不影响搜索引擎蜘蛛用最快的时间抓取到实际的内容。

 

第二、   把脚本移植到以.js为后缀的单独文件,然后通过<script language="javascript" src="/js.js"></script>的形式调用。

 

 

对于网页结构的减肥。

现在有很多网页还是保持着使用table表格布局的形式,这样是非常不利于SEO的。因为table的层层嵌套,会让搜索引擎蜘蛛感觉到页面很大,而且不愿意爬行到深层表格内获得内容,因此,我们应该更多的使用利于搜索引擎优化的DIV+CSS布局。

使用DIV+CSS布局,所带来的直接好处有两点:一是提高蜘蛛爬行效率,能在最短的时间内爬完整个页面,这样对收录质量有一定好处;二是由于能高效的爬行,就会受到蜘蛛喜欢,这样对收录数量有一定好处。

很多网站如何推广的文章中称,搜索引擎一般不抓取三层以上的表格嵌套,这一点一直没有得到搜索引擎官方的证实。我的几项实验结果没有完全出来,但根据目前掌握的情况来看,蜘蛛爬行Table布局的页面,遇到多层表格嵌套时,会跳过嵌套的内容或直接放弃整个页面。从而减小了搜索效率。使用Table布局,为了达到一定的视觉效果,不得不套用多个表格。如果嵌套的表格中是核心内容,蜘蛛爬行时跳过了这一段没有抓取到页面的核心,这个页面就成了相似页面。网站中过多的相似页面会影响排名及域名信任度。

  而DIV+CSS布局基本上不会存在这样的问题,从技术角度来说,XHTML在控制样式时也不需要过多的嵌套。

(以上文字参考SEO大牛樂思蜀)

 

另外,对于网页减肥的办法还有很多种,例如减少图片的使用,减少FLASH的使用等。当然,不是说网页减肥就不能使用FLASH或者图片,我们可以使用其他一些迂回的办法、如调用FLASHJS文件来达到网页减肥的目的。

网页减肥最重要的目的就是提高网页的信噪比,使得网页本身在搜索引擎看来更有价值,因此这一点不容忽视。


轻松几步获得上万点击率(十)专题策略

 

专题策略这个技巧是我昨天在SEO培训中所讲到的,有必要在这里提一下。另外,从今天起基础优化部分就写完了,之后的文章可能更多的会说到一些优化策略和对于搜索引擎改变的一些应对办法和机制。还是请大家继续关注。算法的东西虽然对于整个SEO优化有着至关重要的关系,而且只要熟练掌握算法就几乎可以做到百战百胜,但是毕竟BLOG的篇幅有限,所以如果希望了解算法的可以参加我的SEO培训班,面对CSDN会员学费700元,学期一个月,具体的培训内容见如下网址。

http://www.zeacens.com/SEO_Peixun.Html

 

有些时候我们在搜索某些关键词的时候,会发现一个很特殊的情况,就是排在前面的关键词有些时候是一个门户网站做的专题页面,在这个页面上,都是和这个关键词相关的内容

 

这个道理其实很简单,这是因为专题页面往往反映的内容只有一个关键词,而网站反映的内容却大而杂,而这种“专一”的态度恰恰是搜索引擎所喜欢的,因为搜索引擎蜘蛛不必再花费大量的精力去你的网站搜索和这个关键词相关的内容

 

在这样的情况下,搜索引擎就会给这个专题页更多的权重,所以搜索结果自然也就排在前面了

 

通过上面的这些讲述,我们就可以总结出第一个SEO的办法——将反映同样内容的网站链接放在一个页面上,他在搜索引擎中的权重就会增高,而这样的专题排在前面的几率也就高 

 

SEO进阶篇中,这样的做法叫做“以关键词相关度为基础的网页排序算法”我们以大量的相关内容建立一个专题页面,其相关度就高,排序在前面的几率也就大,这是算法的东西,在之后的培训中我们会提到

 

对于这样的优化办法,我们看看一个实例,请各位在百度搜索“李冰冰”这个关键词

 

我们可以看到,排名第一个和第二个都是百度自己的产品,这个是百度自己的商业行为,我们不去评价,第三位是李冰冰自己的博客,这个是根据相关度排序最高原则所做出的判断。我们主要看看第四位

 

第四位是新浪娱乐做的李冰冰的专题

 

打开这个页面,我们可以发现,除了第一屏对于李冰冰的简单介绍之外,下面的全部都是李冰冰相关的新闻标题链接 

 

这样一来,这个页面就给了搜索引擎很重要的一条信息:这个页面反映的就是李冰冰的相关内容,没有其他内容,因此这个页面本身和“李冰冰”这个关键词的相关度是非常之高的。所以,这个关键词排名就靠在了前面

 

有一些略懂SEO的朋友也许会问我,这个页面里“李冰冰”这个词出现了非常多的次数,页面的关键词密度明显超重,难道不会认为是关键词堆砌作弊吗?

 

这就是专题页面做SEO排名的好处,无论你的关键词密度有多高,只要这些关键词都出现在相关新闻链接里面,而且这个关键词并不是刻意出现的,就不会被认为是作弊,而且因为搜索引擎的算法所致,这样多的关键词反而会提高这个页面在搜索引擎的排名

 

这就是搜索引擎排名的有趣之处,而且这也是搜索引擎优化众多技巧众多中的一个。在以后的学习中我们会提出很多的这种小技巧,帮助大家的网站,有一个好的排名。


 浅谈SEO的关键:中文分词(上)

在搜索引擎技术中,中文分词对于影响搜索引擎结果排序有着至关重要的作用。我们在实际的搜索引擎优化中,为了避免很多主关键词的大量竞争,也会使用到中文分词技术来做SEO优化。举个简单的例子,假如我们需要优化一个内容是“轴承”的网页,那么想要这个关键词在搜索引擎中排名更好,那就是很难的一件事了。因为“轴承”这个关键词热度太高,所以想要通过SEO手段去将其优化到搜索结果的首页是一件非常难的事。在这个时候我们经常会使用长尾关键词去优化这样的高热度关键词,也就是说,我们经常会优化一些例如“北京轴承销售商”、“北京进口轴承”等这样的关键词。而想要把这样的关键词做到搜索结果的前列,对于中文分词技术的把握和对于关键词的布局,有很大的重要性。

中文分词在中国已经是有很久的历史了,明朝末年有一位画家叫做徐渭(文长),据说因为他家过于贫困,根本没有粮食可吃,因此只好跑到亲戚朋友家“蹭饭”。一次两次亲戚朋友不觉得什么,但是时间长了,就感觉很厌恶徐渭。终于有一天,亲戚忍无可忍,不顾外面下着春雨就想把徐渭赶出去,于是在墙上写了一行字,委婉的下了逐客令:

 

“下雨天留客天留人不留”

 

徐渭看到那行字以后,心里自然明白亲戚的意思。但是到了晚上亲戚回到家一看,徐渭居然又在饭桌前等候。主人很奇怪,就问徐渭:“你看到墙上的字了吗?”徐渭笑笑:“看到了,但是没想到你这么好客,既然这样,我也不客气了,就继续住下去吧!免得你自责招待不周。”说完,指指墙上的字,主人一看,差点气晕过去,原来,徐渭在这行字上加了几个标点符号,主人无奈,只好让徐渭继续留下。徐渭是这么写的:

 

“下雨天,留客天。留人不?留。”

 

中国的文字博大精深,不同的标点符号,不同的断句就代表着不同的意思。所以,曾经有一位Google的科学家说:“如果可以做好中文搜索引擎,那么我们就不怕任何语种的搜索引擎研究了。”

 

那么中文分词在搜索引擎优化中到底具有怎样的意义呢?分词对SEO的影响是多方面的,最重要的就是对长尾流量的影响。例如说我们常常见到很多很想做的长尾关键词,例如广州进口轴承销售,上海进口轴承销售等等,但我们通过前文对于SEO的了解可以知道,一个页面做关键词不要超过三个,因为超过三个就会分散了每个关键词的权重,反而一个都做不好。但如果我们想超过三个又不影响呢?那么我们这时候就需要利用中文分词来对关键词进行组合了,例如<title>进口轴承销售-上海-广州<title>。这样分出来的结果可能没有广州进口轴承销售或上海进口轴承销售的关键词来的直接,但用这样分词的办法却使到很多词都获得不错的效果。多个词排名在搜索引擎结果页的首位,总是要比一个关键词排名在第一位的覆盖面要广。久而久之,因为 广州+进口轴承销售、上海+进口轴承销售这些页面让搜索引擎知道你的页面和“进口轴承销售”这个关键词相关度很高,因此进口轴承销售这个主关键词的排名也会相对提高。

当然,我们上面举得例子是还没有完全对于关键词进行完全的拆分。下面我们就对中文分词做一个粗略的讨论。

最早的中文分词办法是由北京航天航空大学的梁南元教授提出的,一种基于“查字典”的分词办法。例如这个句子:“著名导演张艺谋说国庆节晚上将安排十万人到天安门联欢。”

“查字典” 的分词方法,我们要做的就是把整个句子读一遍,然后把字典里有的词都单独标示出来,当遇到复合词的时候(例如北京大学),就找到最长的词匹配。遇到不认识的字符串就分割成单个文字。根据这样的办法,我们以上的文字可以切分为:

“著名 | 导演 | 张艺谋 |   |  国庆节 | 晚上 | | 安排 | 十万人 | | 天安门  | 联欢”

这样的分词办法虽然说可以应付很多的句子,但是由于细分的太多,在真正搜索引擎使用的过程中,到底哪一个词才是重点就无法表述,从而搜索引擎搜索出的结果也不能达到最大的相关度。于是在80年代,哈尔滨工业大学计算机博士生导师王晓龙博士提出了“最少词数”的分词理论,即为,一句话应该是分词最少的字符串,这样会更多的让搜索引擎更明白这句话到底是什么意思。但是这样的办法虽然更好,新的问题却也显现了出来。例如,我们在做“二义性”关键词组的时候,就不能说最长的分割就是最好的结果。举个例子,“吉利大学城书店”这个关键词正确的分词应该是“吉利 |  大学城  |  书店”而不是词典中的“吉利大学 | | 书店

 

目前,主流的分词办法有两种,一种是基于统计模型的文字处理,另外一种是基于字符串匹配的逆向最大匹配法。

 

基于统计模型的文字处理

 

从形式上看,词是稳定的字的组合,因此在上下文中,相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映成词的可信度。可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息。定义两个字的互现信息,计算两个汉字XY的相邻共现概率。互现信息体现了汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计,不需要切分词典,因而又叫做无词典分词法或统计取词方法。但这种方法也有一定的局限性,会经常抽出一些共现频度高、但并不是词的常用字组,例如“这一”、“之一”、“有的”、“我的”、“许多的”等,并且对常用词的识别精度差,时空开销大。实际应用的统计分词系统都要使用一部基本的分词词典(常用词词典)进行串匹配分词,同时使用统计方法识别一些新的词,即将串频统计和串匹配结合起来,既发挥匹配分词切分速度快、效率高的特点,又利用了无词典分词结合上下文识别生词、自动消除歧义的优点。(上文引自SEO专家论坛)

基于统计模型的文字处理,因为技术性比较高,而且只是使用在搜索引擎分词算法的过程中,如果学会,对于SEO的帮助会更大,各位可以加入我的SEO培训班进行深入讨论。这里更多的说一下基于字符串匹配的逆向最大匹配法。

一般来说,我们在SEO中使用最多的分词办法就是基于字符串匹配的逆向最大匹配法。这个办法其实很简单。我们以一个简单的例子来说明。

“瑞星一直以质量和服务开拓安全市场”。

如果这个句子我们以“查字典”的办法正向切分的话,就会切分成下面的句子。

“瑞//一直//质量/和服//开拓/安全/市场”

我们可以看到,正向切分出现了一个重大的错误“和服”,而“和服”这个关键词是日本的传统服饰,和这句话的意思根本没有任何关系,如果真的这样去分词的话,那么在真正搜索引擎索引的过程中,我们搜索“和服”也会出现这样的错误结果。

因此我们开始做逆向最大匹配法。从这句话的后面往前读(从右向左)

“瑞//一直//质量//服务/开拓/安全/市场”。

这个分词办法才是正确的。

 

浅谈SEO的关键:中文分词(下)

在搜索引擎运行的机制中,有很多种中文分词的办法,例如上一篇文章中提到的正向最大匹配分词、逆向最大分析、基于统计的分词等。但是在实际的搜索引擎运行过程中,分词的办法却没有这么简单了。因为搜索引擎不仅仅要去考虑到分词结果的正确性,还需要考虑到对于分不出来的词的处理。

首先我们来讨论分词结果的准确度,一般来说,搜索引擎是使用多种分词的方式构成一个混合分词方式来进行分词的,因为这样可以让词汇最大化的、更准确的分开。混合分词的原理是:先使用专业词典进行分词,之后再使用普通词库进行一次分词。以一个简单的例子来说明这个问题。

例如我们现在有这样一句话“电子邮件营销”如果我们的词库中有“电子邮件”这个关键词,那么就可能会被分成是“电子邮件/营销”,如果没有这个词的话,那么就有可能被分为:“电子/邮件/营销”这样我们就出现了一个问题,假如我们单纯的使用第一种分词方式和词库,那么我们如果单纯搜索“邮件”“营销”这样的关键词时,就找不到“电子邮件营销”这样的结果,同理,单纯的使用第二个词库,也找不到“电子邮件”这个词。

因此在这里我们就需要使用混合分词的办法了,我们拥有之上两个词库和两种以上的分词方法。同样的例子,如果我们加以综合,分词的结果就变成了下面的形式。

电子邮件营销=>电子邮件/邮件营销=>电子/邮件/营销

这样的分词方法,就可以帮助我们更多的获得准确的搜索结果

 

那么对于分不出来的词,搜索引擎又是如何操作的呢?

网络文化发展速度快的标志不仅仅是我们日益提高的硬件和网速,更多的是表现在新生词汇的诞生。那么新词刚刚出来的时候,搜索引擎并不知道怎么切分时,该怎么办呢?

例如前一段时间把百度百科推到风口浪尖的新词汇“草泥马”,这个新词的出现一定是百度所始料不及的,那么如果出现了下面的这样一句话,百度又是如何去分词的呢?

“草泥马是一种食草动物”

一般来说,搜索引擎遇到这样的关键词时,会采取一元分词+二元分词+混合分词+不分词的方式来解决这样的问题。如果是一元分词,那么这句话分出来的结果应该是:“草////一种/食草/动物/”或者“草////一种/食草动物/”或者“草////一种///动物/

但是显然,这样的结果如果我们单纯搜索“草泥马”这个关键词时,是不会准确的被认为是相关内容的。因此,继续使用二元分词的办法“草泥/泥马//一种/食草/动物”。有了这个分词方式以后,我们原来句子出现在索引结果中的概率就变大,但是这个依然不是最好的,于是搜索引擎还有第三种方式——干脆不分,以保持新词的完整性。

在经过了这一系列的分词程序后,实际分词的结果是如同下面这样的。

 

草泥/泥马/草泥马//一种/食草///动物/食草动物

 

OK ,我们现在已经知道了中文分词的一些办法,那么以上的两种分词办法对于我们的SEO有什么好处呢?

前文我们讨论过,掌握了中文分词技术,我们就可以让自己的网页有更多的长尾关键词,从而让更多的关键词可以排名在百度、Google的搜索结果前列,那么同上面的这两种分词方法,我们就可以根据更多的这样的分词理论去构建一个长尾的title,长尾的keywords等。让你的网站从更多的关键词中获得流量。

 

 

 

原创粉丝点击