robots.txt
来源:互联网 发布:30岁女装品牌 知乎 编辑:程序博客网 时间:2024/04/23 19:16
Rails 中的 robots.txt
# See http://www.robotstxt.org/robotstxt.html for documentation on how to use the robots.txt file## To ban all spiders from the entire site uncomment the next two lines:# User-agent: *# Disallow: /
“ User-agent:* ”表示本节适用于所有机器人。“ Disallow:/ ”告诉机器人它不应该访问网站上的任何页面。使用/robots.txt时有两个重要的注意事项:机器人可以忽略您的/robots.txt。特别是扫描Web的恶意软件机器人的安全漏洞,以及垃圾邮件发送者使用的电子邮件地址收集器将不会引起注意。/robots.txt文件是公开可用的文件。任何人都可以看到您的服务器的哪些部分不希望机器人使用。
# https://www.taobao.com/robots.txt 页面User-agent: BaiduspiderAllow: /articleAllow: /oshtmlAllow: /wenzhangDisallow: /product/Disallow: /User-Agent: GooglebotAllow: /articleAllow: /oshtmlAllow: /productAllow: /spuAllow: /dianpuAllow: /wenzhangAllow: /overseaAllow: /listDisallow: /User-agent: BingbotAllow: /articleAllow: /oshtmlAllow: /productAllow: /spuAllow: /dianpuAllow: /wenzhangAllow: /overseaAllow: /listDisallow: /User-Agent: 360SpiderAllow: /articleAllow: /oshtmlAllow: /wenzhangDisallow: /User-Agent: YisouspiderAllow: /articleAllow: /oshtmlAllow: /wenzhangDisallow: /User-Agent: SogouspiderAllow: /articleAllow: /oshtmlAllow: /productAllow: /wenzhangDisallow: /User-Agent: Yahoo! SlurpAllow: /productAllow: /spuAllow: /dianpuAllow: /wenzhangAllow: /overseaAllow: /listDisallow: /User-Agent: *Disallow: /
阅读全文
0 0
- robots.txt。
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- robots.txt
- Robots.txt指南
- Robots.txt指南
- robots.txt用法
- tp3的单字母函数在thinkphp5.0改为助手函数简介
- Oracle学习笔记 字符集概述
- 51nod 1163 最高的奖励
- 基于TensorFlow的机器学习(1) -- 基础介绍
- Java中@Override的作用
- robots.txt
- [noip2015]跳石头 题解
- i2c适配器驱动源码分析(i2c总线驱动)
- 单例模式以及多线程
- C++风格_类型转换
- python的对象赋值、浅拷贝和深拷贝
- Httpd2.2常见配置及功能
- 如何制作一个平台游戏
- Java中Error与Exception的区别