Wordpress博客robots.txt写法
来源:互联网 发布:java开发工程师培训 编辑:程序博客网 时间:2024/05/02 04:17
使用Wordpress搭建的博客,利用robots.txt文件限制搜索引擎抓取部分目录及文件,归纳大致有以下几种方法。
最简单的开放写法
不作任何限制,Wordpress站内链接结构比较合理,作为一般博客,完全开放就可以了,代码:
User-agent: *
Disallow:
允许所有蜘蛛访问,允许访问所有内容。Wordpress只要模板中链接设计合理,没有需要限制的特殊内容,推荐使用这种写法。
最简单的严格写法
User-agent: *
Disallow: /wp-*
#Allow: /wp-content/uploads/
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /?s=
允许所有蜘蛛访问,限制以“wp-”开头的目录及文件,限制抓取.php文件、.inc文件、.js文件、.css文件,限制抓取搜索结果。
Disallow: /wp-* 会连同附件目录一起限制抓取,如果想让搜索引擎抓取附件中的内容,将第三行的 # 号注释去掉。Allow 不是所有搜索引擎都支持。
最合理的写法
卖瓜的都说自己瓜甜,我也觉得自己的Robots.txt写的最合理
User-agent: *
Disallow: /wp-admin
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-includes
Disallow: /?s=
Sitemap: http://www.lesishu.cn/sitemap.xml
允许所有搜索引擎抓取,逐一列举需要限制的目录,限制抓取搜索结果。
包含sitemap.xml地址(这一项viki中有专门的说明,但Google管理员工具会提示‘检测到无效的 Sitemap 引用’,有效性尚有争议)。
robots.txt其他写法
为避免在搜索引擎中出现重复页面,Wordpress玩家自创了很多robots写法,列举一些常用的,作为参考(适用于伪静态方式的永久链接):
Disallow: /page/
#限制抓取Wordpress分页
Disallow: /category/*/page/*
#限制抓取分类的分页
Disallow: /tag/
#限制抓取标签页面
Disallow: */trackback/
#限制抓取Trackback内容
Disallow: /category/*
#限制抓取所有分类列表
最后,推荐使用 Google管理员工具,登录后访问“工具 -> 分析 robots.txt”,检查文件有效性。
作者:樂思蜀
原文:Wordpress博客robots.txt写法
版权所有,转载时必须以链接形式注明作者和原始出处并保留本声明。
- Wordpress博客robots.txt写法
- Wordpress博客robots.txt写法
- 用wordpress建站robots.txt的写法
- wordpress教程robots规范写法robots.txt经验分享
- 论WordPress网站robots.txt的正确写法
- robots.txt写法总结
- robots.txt写法大全
- wordpress 添加修改 robots.txt
- 详细讲解robots.txt写法
- SEO 必备--robots.txt写法
- zen cart robots.txt 写法
- robots.txt作用和写法
- robots.txt的详细写法
- robots.txt 文件写法大全
- robots.txt写法大全和robots.txt语法的作用
- Wordpress如何正确书写Robots.txt
- wordpress中如何正确书写robots.txt
- robots.txt的语法和写法详解
- 手把手教你JavaScript - 扫盲贴
- x3d简介
- VC++6.0中内存泄漏检测
- 变量中的相互转换
- 常用CSS
- Wordpress博客robots.txt写法
- 三层架构讨论贴
- C++风格的类型转换的用法
- 写VB.Net代码时候要注意字体问题。
- JavaScript之网页对话框
- C++调用Java web service帮助文档
- HashMap的键值以及键和值的遍历(TreeMap同)
- 忘掉风险投资吧,创业者!
- Sql与Asp.Net数据类型对应(引用MsDN)