《Web标准和SEO应用实践》读书笔记-摘要

来源:互联网 发布:web science数据库 编辑:程序博客网 时间:2024/04/30 11:36
这本书的英文名称是叫《Building Findable Websites -- Web Standards,SEO,and Beyond》,我觉得书名可叫为《创建易发现性的网站》更加贴切。正本书分为9个部分,下面我抽选其中我觉得比较重要的内容来谈谈。

    整本书的内容是围绕“易发现性”这个主题来写,而SEO只是实现易发现性的一个部分,要做到易发现包括了下面几个方面:

  • 信息架构
  • 开发
  • 营销
  • 文案
  • 设计
  • 搜索引擎优化(SEO)
  • 易访问性
  • 可用性


   以下摘自原文:“当搭建重要网站时,大公司通常的做法是:制定计划、成立项目、最后引入搜索引擎优化公司,专门解决网站易发现性的问题--往往很少涉及代码、设计、文案、可用性或内容的组织。虽然网站建立之后,还是可以做一些事情来改善网站的易发现性,但你会发现,如果一开始它就集成到流程中,工作就会更容易、更有效。你也可能发现这更节省成本,因为你合理利用内部资源和人才,而不是依赖昂贵得搜索引擎优化公司网站”作者强调了易发现性贯穿整个Web项目的声明周期,集合了网络规划,设计和开发过程,并涉及所有团队成员。以上也是第一章的主要内容

 

    第二章内容是关于“标记策略”。这里是关于Web标准的问题,遵循Web标准可以改善易发现性,使内容对搜索引擎更有意义。这里谈到的是具体的一些HTML标签的用法:

  1 <h1>、<h2>、<h3>标题标签:
  这个三个标签可以想象为一个金字塔,最上面只有一个点,也就是说<h1>的等级是最高的只用一次,<h2>低一级可以用几次,<h3>等级最低可以重复用多次构成金字塔的底部,但他们仍然比普通文本重要。

  2 <strong>、<em>标签:
这两个标签可用于强调内容中的一小部分,最适合在文章内容中强调关键字。

  3 <meta>标签:
这里提到除了用meta的"description"等来放关键字可提高SEO外,这里强调了避免使用机器人<meta name="robots" content="all">,因为搜索引擎蜘蛛爬遍网站全部内容,所以机器人是不需要的,可节省不必要的工作。

  4 用lang属性,在meta中加入lang属性来表示使用什么语言如:lang="en-us"

  5 避免使用刷新,避免<meta http-equiv="Refresh" />这种用法

  6 始终包括内容类型:就是meta标签要标明页面的编码,这个一般网页会默认编码,笔者建议都用utf-8编码,因为它很好的支持中文和各种字符

  考虑可选meta标签:author、content-language、copyright、geo等

  8 阻止内容索引:可以帮助控制哪些内容被索引,那些隐藏:
         no follow、noindex meta
         robots-nocontent  
  用法:<meta name="robots" value="noindex,nofollow"/>
        <div class="robots-nocontent">隐藏的内容</div>

 

  9 图片信息要加入"alt"属性的文字说明部分,不是重点要显示的图片如装饰尽量用背景图代替

  10 正确使用表格,不是div+css就一定不用table,当数据是以表格形式呈现时,还是要用表格,因为表格布局能做到div做不到的显示。
这里提到的表格的格式:
  <table summary="Top-selling espresso machines">
  <caption>spresso Impresso's top-selling commercial espreesso machines</caption>
  <thead>
  <tr><th id="model">model</th><th id="price">price</th><th id="num-sold">number</th></tr>
  </thead>
  <tbody>
  <tr><td>...</td><td>...</td><td>...</td></tr>
  </tbody>
  </table>

其中summary和caption中的内容用来告诉搜索引擎和用户表格中表达了什么。

  11 微格式(Microformats)
  微格式是一个比较新的概念,目前只有firefox 3.0版本和ie 8以上版本支持。这里要解析一下什么是微格式。
  微格式是注入到Web页面中的小段信息,通过语意相关让信息块内容人机可读。微格式的采用可以帮助机器搜集、理解和处理Web页面所包含的内容。在Web页面上,允许的微格式数据包括事件、人物、地点等各种信息。这些微格式内容可被其他应用检测到,并提取其中相应信息,进而对信息进行索引、搜索或把信息以其他形式重用或组合。从技术上看,微格式表示的数据是一些语义标记,用标准的(X)HTML的形式表示。微格式尝试将常用元素的语义进行标准化,随之衍生了一系列新的表示方式,比如针对事件描述的hCalendar (源自于iCalendar 格式),针对个人和商务信息的hCard (源自于vcard 格式),以及针对新闻的存储格式hAtom (源自于atom 联合格式)等等。与此同时,微格式对于搜索引擎SEO 有着很高的价值,容易使站点对外暴露的数据轻松的纳入到搜索引擎的索引中,便于站点提供的信息在互联网上传播。firefox3.0下载一个operator插件,只要页面上有微格式存在,这个插件便能识别并且能快速使用微格式中的内容。

 

第三章是关于服务器端的提高易发现性的策略,注意几点:

  1 用301重定位来移动页面和域,用定制的404页面讲用户带回页面。
  2 给文件命名的时候,不要用下划线例如my_page.html要改成是my-page.html,因为用下划线不利于搜索引擎解读名字的意思,会误解为my_page是连在一起,而用"-"会解读为"my"、"page".
  3 用Gzip压缩文件
  4 减少http请求
  5 用robots.txt控制搜索引擎索引
  6 文件大小
页面的访问速度同样影响易发现性,文件大小的减少可以通过压缩javascrip和css代码来实现。这里介绍了两个非常有用在线压缩地址:
javascript在线压缩:http://dean.edwards.name/packer/ (这个可以压缩到像jquery的代码效果,文件大小可以减少40%以上非常好用)
css压缩:http://www.cssdrive.com/index.php/main/csscompressor/

 

第四章:创建吸引流量的内容:

  这里提出了高质量的内容也是提高可发现性的重要方法。高质量的内容应具有下面几点:
  1 保持主题
  2 填补空白
  3 是权威的和有激情的
  4 是可操作,具有娱乐性,或对用户有吸引力
  5 是原创的
  6 对用户使用适当的语气

  这里介绍了Google的AdWords关键字分析工具:https://adwords.google.com/select/KeywordToolExternal
输入关键字便可以分析关键字的被用来搜索的频率。

 

第五章是关于建构易发现的博客,改善blog的易发现性的最佳做法:
  1 定期撰写,聚焦话题
  2 经常链接,并链接到其他博客帖子,以产生返回链接
  3 创建自己的博客模板
  4 把关键词放在帖子标题中
  5 按主题归档
  6 总结帖子,以更好地引入导流量
  7 添加热门帖子区
  8 添加最近帖子区
  9 告诉用户你是谁,还有你的博客是关于什么的

 

第六章在网站内添加搜索,这里介绍添加google、yahoo站内站外搜索的方法。

 

第七章 防止易发现性障碍
这章的要点是:
  1 把css、javascript代码作为外部引用文件添加在页面上。
原因是:大量的css、javascript代码会导致搜索引擎找到页面用价值的信息的难度增大,也影响页面的打开的速度,因为作为外部链接的时候,css、javascript文件只加载一次,而不用每次打开的时候都加载。

  2 javascript导航问题,有些javascript写的导航菜单,当用户屏蔽了javascript就不能显示了,这样用户在没有启用javascript的情况下不能找到导航的位置。同样搜索引擎也不能搜索到javascript写的菜单导航的链接。

  3 易发现的flash,Flash中的内容无法被搜索引擎收纳,大大影响了可发现性。书里提到一个做法是:用SWFObject来达到Flash渐进式加强。SWFObject是一个js文件,用于页面显示flash,网上能找到它的下载地址。

  <div id="flash-promo">
  <a href="promos/" title="See our latest promotions">
  <img src="images/promo.jpg" alt="Save 10% on the Berry Bowl" longdesc="#slideshow"/>
  </a>
  </div>

  <script type="text/javascript" src="js/swfobject.js"></script>
  <script type="text/javascript">
  var so = new swfobject("slideshow.swf","myswf","600","400","8","#ffffff");
  so.write("flash-promo");
  </script>

  参数说明:slideshow.swf:嵌入swf的路径
          myswf:Javascript对象的名称
          600:宽度、400:高度
          8:flash播放器版本号
          #ffffff:flash的背景颜色

  当用户没有flash播放器的时候,用户看到<div id="flsh-promo">...</div>中的内容,不影响页面的正常使用。

  4 ajax同样造成不可见的内容,这里提到一个解决办法是如果浏览器不支持javascript,渐进式加强的界面会把用户带到单独的产品网页,那里需要刷新页面来加载内容

 

第八章:用邮件列表挽回流量。
这章要点:
  1 鼓励订阅
  2 使用邮件列表管理系统
  3 建立基于ajax的订阅系统

 

第九章主要式前面8章的总结,提到了前面几章内容的执行的优先级问题:


优先级1 :
  创建填补空白,与用户相关的精美的原创内容
  研究目标关键字,并放置在标记内的战略位置
  使用语义的标准兼容代码
  满足易访问性指南,以确保内容对搜索引擎是易读的
  如果可那个,建立站内链接,并在其它网站宣传你的网站
  发布robots.txt
  创建404页面,把用户带回你的网站
  建立HTML网站地图
  确保javascript、flash内容不会阻止搜寻引擎索引
  坚持分析成功和失败的流量

 

优先级2
  在网站中添加本地搜索引擎
  用微格式
  创建blog
  用rss聚合内容
  促进内容的病毒式交流
  优化网站性能

 

优先级3
  建立利用邮件列表
  考虑通过google的adwords活动来吸引即使的流量
  通过线下媒体推广网站

原创粉丝点击