搜索引擎入门(一)

来源:互联网 发布:js.com 编辑:程序博客网 时间:2024/04/30 09:45

郑重申明:本系列文章是学术性文章,请认真对待!如果你面带微笑看完,请重新认真阅读!

作者:ylfDSB-元

---------------------------------

from now on,开始小小研究下搜索引擎这个让我感到可怕的喜爱的领域,因为这里的算法可以说是现在最先进的,而且这里提供的服务是最一流 的,也是Google百度这些公司让我着迷膜拜。。。忽略我的无知。。。当然还有一个原因:以后下东西大笑哈哈哈 不拍没资源咯~~~你懂的。。

    作为第一篇文章,那就老调重弹。。。

     老调第一节:搜索引擎的分类

     目前搜索引擎的分类一般分为三类:

(1)目录式搜索引擎,例如雅虎新浪这些网址首页,他们被称为门户网站应该也是这个原因把,我们可以通过他们的索引目录来找到我们感兴趣的网址,这种一般是采用人工收录的方法。

(2)全文搜索,这类搜索引擎就是我们现在天天在用的Google baidu 搜狗 等等,他们是自动通过下载系统在互联网上搜集网页,通过分析系统分析网页并建立索引库,从而面向我们用户进行查询。这也是我最神往的禁地^^总是让我一惊一喜,痛并快乐的处女地。

(3)元搜索引擎,顾名思义,元XX就是指XX的XX,这里就是搜索引擎的搜索引擎,有点拗口,就是元搜索引擎自己不收集网页,他将用户查询发送给上述两个搜索引擎,让上述两个搜索引擎返回结果,然后元搜索引擎对结果集进行重新排序,这种可以综合多个搜索引擎进行,优化结果。。可是怎么可以窃取他人的革命果实呢?阿弥托福哦。好像以前出现过的谷姐八成就是这么干的,,还是要像衣食父母学习的!

     老调第二节:搜索引擎的历史

    那是很久很久以前的事情,记得是我刚出生的时候。。。

    1990年以前,没有人

     1990年,有了McGill University的AlanEmtage、Peter Deutsch、Bill Wheelan发明的Archie 用在Ftp上

    后来的太多事情,还小,记不住,忘了。。google之百度之

    老调第三节:相关的搜索引擎世界顶级会议

       可能不是很跟得上时代:就先罗列:

     TREC(Text Retrieval Conference)文本检索会议

    SIGIR(Special Interest Group on Information Retrieval)ACM的信息检索专业组

     SIGMOD(Special Interest Group on Management of Data) ACM数据管理组

    KDD(Knowledge Discovery and Data Mining) 数据挖掘相关的

    还有就是参考Google的发表文献,很有价值

     

     真心不想打字了,太累了。。。生得如此粗犷的手怎么是用来打键盘的呢?真是杀鸡用牛刀,抬大米去了。。。明天或者明天的明天写第二篇。。(广告:**************回复本帖可见)

----------------------------------

郑重申明:本系列文章是学术性文章,请认真对待!如果你面带微笑看完,请重新认真阅读!

作者:ylfDSB-元


原创粉丝点击