Internet偶记续II

来源:互联网 发布:一长列数据等分成多列 编辑:程序博客网 时间:2024/05/21 18:47
Google是最流行的网络搜索工具之一。入门非常简单,敲入几个单词,然后回车看结果就行了。用的比较巧的人一般都会一些Google的定制搜索技巧。学习起来挺容易的,就不多说了。记忆力不好的人请参照使用http://www.faganfinder.com/engines/google.shtml
Google提供几十亿个网页的全文搜索,对于纳入它检索的网页,有很强的文本匹配的信息提取能力。需要指出的是这些网页中不包括刚刚生成的和将要生成的网页,因为它们还没有被Google检索到;不包括大于101K的网页;不包括已经检索到,但是被搜索算法忽略的网页;也不包括被搜索算法检索出,但是用户无法访问到的网页(例如被网管屏蔽)。在搜索引擎功能这么强的前提下说一下它找不到什么还是有意义的。
还有就是Google自身不提供黄页式的网站归类,http://directory.google.com 利用http://dmoz.org/提供的数据,是由志愿者维护的。此网站包含中文,不过不知道在简体中文使用者中有多少志愿者在努力维护它。Google能在简体繁体中文之间转换,需要注意的是它们字虽然一样,但是在语言习惯上已经有很大的不同。比如尽可能全的搜索“影片”就还要连“硬碟”一起搜。
 
另外一个好玩的东西是http://www.google.com/press/zeitgeist.html,在它上边可以看到在Google里正在流行什么。
 
Google的Gmail的存在的价值远超过邮件服务的价值,使Web的个性化访问和面向个人的服务成为可能,对应一个Gmail邮箱作标示,用户可以拥有个人帐户。Google的个性化主页已经是Portal化了。似乎有Intranet上的所有技术都有被改改,然后被搬到互联网之势。
 
Google News跟踪数千个News sources,你可以搜索最近正在发生的事情,Google的新闻聚类可以把相似的新闻合并到一起显示,这样会有更好的视觉体验,避免同一事件的新闻充斥着你的网页。如果你只想知道有哪些事正在发生,而不在乎媒体的风格和倾向,Google News是不错的选择。如果你有喜欢的媒体,那就直接去看好了。
 
Google Group提供Usenet和论坛的内容搜索。Usenet不同于网页信息资源,早在网页流行以前就产生了,并还在增加。包含大量的话题、答案和讨论,以及大量信息垃圾。但是靠搜索帮助还是可以找到一些老旧问题的答案。因为很少有人把旧古董制作成网页,网页搜索对于Usenet上的帖子用处就不大了。其实如果想深入一个问题,有时Usenet比网页论坛讨论的更多更深入,信息/垃圾比更高,当然前提是话题被讨论过,像简体中文的资源就少多了。中文资源还主要集中在网页论坛上,谁让我们起步晚呢,我们有我们的国情。
 
Google Blog用于搜索博客,Blog是最新发展起来的网络日志,本质上它属于个人出版物,有了它我们实际上就部分的规避了出版审查制度。博客单个页面上很少有统一的主题,一个人特别的生活构成它的线索和脉络。Blog搜索特有针对性,搜索目标包括标题、摘要和内容等等。将来更要有大量的非文本二进制格式内容出现。目前只有存在RSS feed的blog被索引。 还要声明一下BlogSearch.google.com和search.blogger.com是一个东西。
如果有兴趣还可以浏览一下这两个网站:
Technorati http://www.technorati.com
BlogPulse http://www.blogpulse.com
 
原创粉丝点击