高效搜索 Google搜索语法简介

来源:互联网 发布:超高清壁纸软件 编辑:程序博客网 时间:2024/05/29 13:45
高效搜索 Google搜索语法简介
 
  目前,Internet 上有两种搜索引擎。一种是The Searchable Subject Index,索引式搜索。这种搜索引擎只搜索站点的Title和Meta描述信息而无法搜索个人主页,Yahoo就是一个索引式搜索引擎。第二种是The Full-Text Search Engine完全内容搜索引擎,通过Spider(蜘蛛) 技术搜索数百万个甚至数十亿个页面,而且可以搜索页面的Title和内容。所以能够比索引式搜索做更全面的搜索,Google就是一个完全内容搜索引擎。

 

图1 Google搜索主页

基本连接符

  Google 默认的连接符是AND,意味着如果你不加其他修饰符号直接搜索的话,Google就会对所有的关键字同时进行搜索。

  snowblower Honda "Green Bay"

  如果要从几个关键字中指定任中一个,可以使用OR 连接符。

  snowblower OR snowmobile OR "Green Bay"

  如果要明确的指出2个或多个关键字使用OR连接,可以用括号连接。

  snowblower (snowmobile OR "Green Bay")

  同时你也可以使用电脑编程里管道符号 "|" 来表示OR的功能。如果要在搜索结果中不包括某个关键字,使用-(减号/短横线)。

  snowblower snowmobile -"Green Bay"

  Google将搜索包括snowblower 和 snowmobile ,不包括Green Bay。

简单搜索和手气不错

  手气不错是Google一个很有特色的功能。你可以迅速得到Google认为的最符合你搜索结果的页面(就是最常搜索的结果)。

  比如你搜索washington post 手气不错会把你带到 http://www.washingtonpost.com/。而president 则是 http://www.whitehouse.gov/

大小写

  很多的搜索引擎是大小写敏感的,比如你搜索GEORGE WASHINGTON,就无法搜到"George Washington","george washington"。Google是不区分大小写的,搜索Three,three,THREE都可以得到相同的结果。

特殊语法

  除了基本的AND,OR连接符外,Google还提供了高级搜索的语法。

图2 高级搜索

  intitle: 限制你搜索的网页标题。allintitle: 搜索所有关键字构成标题的网页。但是推荐不要使用allintitle: 这个语法,因为他和其他的语法合起来使用的效果并不好。

  intitle:"george bush"

  allintitle:"money supply" economics

  inurl: 用于搜索网页上包含的URL。这个语法对寻找网页上的搜索、帮助之类的很有用。

  allinurl: 功能类似allintitle: 但也同样不推荐使用。

  inurl:help

  allinurl:search help

  intext: 只搜索网页<body>部分中包含的文字(也就是忽略了标题、URL等的文字)。

  allintext: 不推荐使用。

  intext:"yahoo.com"

  intext:html

  inanchor: 搜索连接中包含锚点标记。锚点标记就是指连接的标记,比如<a href="http://www.oreilly.com>;O'Reilly and Associates</a> 中的O'Reilly and Associates就是锚点标记。

  inanchor:"tom peters"

  site: 可以限制你搜索范围的域名。

  site:loc.gov

  site:thomas.loc.gov

  site:edu

  site:nc.us

 link: 可以得到一个所有包含了某个指定URL的页面列表。例如link:www.google.com 就可以得到所有连接到Google的页面。不用担心http:// 部分,事实上即使你输入了Google也会将其忽略。

  cache: 搜索Google索引里页面的副本,即使他原本的URL已经不存在或者完全发生了变化,这部分很适合页面经常变动的搜索。如果Google搜索不到你输入的关键字,那么很有可能你所看到的是Google缓存着的最新页面。

  cache:www.yahoo.com

  daterange: 限制搜索特定时间段里的检索内容。注意是加入Google检索的时间,而不是页面创建的时间。但是这个时间在Google整理检索的时候不会发生变化。比如一个网页是February 2制作的,加入Google检索的时候是April 11,使用daterange:检索的时候就在April 11的检索里被搜索到。Google在August 13重建了索引,但仍然在April 11里被搜索到。daterange:的格式是Julian,而不是Gregorian格式。

  "George Bush" daterange:2452389-2452389

  neurosurgery daterange:2452389-2452389

  filetype: 搜索文件的后缀或者扩展名,注意filetype:htm和filetype:html会得到不同的结果。你也可以搜索各种不同的页面脚本语言,比如ASP、PHP、CGI等等。Google对部分Microsoft的文档也做了索引,比如PowerPoint (PPT),Excel (XLS),and Word (DOC)等等。

图3 限定搜索文件格式

  homeschooling filetype:pdf

  "leading economic indicators" filetype:ppt

  related: 搜索和指定页面相关的页面,比如你搜索related:google.com,会得到很多搜索引擎,比如HotBot、Yahoo!、Northern Light等等。

  related:www.yahoo.com

  related:www.cnn.com

  info: 提供一个和指定URL更多信息的页面列表,包括URL缓存的连接,包括URL的连接和URL相关的连接,包含URL的页面。注意,这里搜索的结果取决于Google是否对该URL进行了索引,如果没有的话搜索结果将会少很多。

  info:www.oreilly.com

  info:www.nytimes.com/technology

  phonebook: 用于查询电话号码。

  phonebook:John Doe CA

  phonebook:(510) 555-1212

原创粉丝点击