搜索引擎入门(一)
来源:互联网 发布:js.com 编辑:程序博客网 时间:2024/04/30 09:45
郑重申明:本系列文章是学术性文章,请认真对待!如果你面带微笑看完,请重新认真阅读!
作者:ylfDSB-元
---------------------------------
from now on,开始小小研究下搜索引擎这个让我感到可怕的喜爱的领域,因为这里的算法可以说是现在最先进的,而且这里提供的服务是最一流 的,也是Google百度这些公司让我着迷膜拜。。。忽略我的无知。。。当然还有一个原因:以后下东西哈哈哈 不拍没资源咯~~~你懂的。。
作为第一篇文章,那就老调重弹。。。
老调第一节:搜索引擎的分类
目前搜索引擎的分类一般分为三类:
(1)目录式搜索引擎,例如雅虎新浪这些网址首页,他们被称为门户网站应该也是这个原因把,我们可以通过他们的索引目录来找到我们感兴趣的网址,这种一般是采用人工收录的方法。
(2)全文搜索,这类搜索引擎就是我们现在天天在用的Google baidu 搜狗 等等,他们是自动通过下载系统在互联网上搜集网页,通过分析系统分析网页并建立索引库,从而面向我们用户进行查询。这也是我最神往的禁地^^总是让我一惊一喜,痛并快乐的处女地。
(3)元搜索引擎,顾名思义,元XX就是指XX的XX,这里就是搜索引擎的搜索引擎,有点拗口,就是元搜索引擎自己不收集网页,他将用户查询发送给上述两个搜索引擎,让上述两个搜索引擎返回结果,然后元搜索引擎对结果集进行重新排序,这种可以综合多个搜索引擎进行,优化结果。。可是怎么可以窃取他人的革命果实呢?阿弥托福哦。好像以前出现过的谷姐八成就是这么干的,,还是要像衣食父母学习的!
老调第二节:搜索引擎的历史
那是很久很久以前的事情,记得是我刚出生的时候。。。
1990年以前,没有人
1990年,有了McGill University的AlanEmtage、Peter Deutsch、Bill Wheelan发明的Archie 用在Ftp上
后来的太多事情,还小,记不住,忘了。。google之百度之
老调第三节:相关的搜索引擎世界顶级会议
可能不是很跟得上时代:就先罗列:
TREC(Text Retrieval Conference)文本检索会议
SIGIR(Special Interest Group on Information Retrieval)ACM的信息检索专业组
SIGMOD(Special Interest Group on Management of Data) ACM数据管理组
KDD(Knowledge Discovery and Data Mining) 数据挖掘相关的
还有就是参考Google的发表文献,很有价值
真心不想打字了,太累了。。。生得如此粗犷的手怎么是用来打键盘的呢?真是杀鸡用牛刀,抬大米去了。。。明天或者明天的明天写第二篇。。(广告:**************回复本帖可见)
----------------------------------
郑重申明:本系列文章是学术性文章,请认真对待!如果你面带微笑看完,请重新认真阅读!
作者:ylfDSB-元
- 搜索引擎入门(一)
- 搜索引擎入门(二)
- 搜索引擎探究(一)
- 搜索引擎(一):基本知识
- 搜索引擎(一)-- 初识
- 搜索引擎比较(一)
- 搜索引擎学习(一):搜索引擎学习
- SEO 入门知识(一)--目录网站DMOZ与搜索引擎Google的比较
- 搜索引擎入门
- 搜索引擎入门
- 搜索引擎算法研究(一)
- 分布式搜索引擎介绍(一)
- 自制图片搜索引擎(一)
- 搜索引擎(一)
- 自己动手做图片搜索引擎(一)
- 搜索引擎中的动态摘要开发(一)
- 实现自己的搜索引擎(一)
- 搜索引擎(一)体系结构 思维导图
- Qt代理(委托)执行的顺序
- 多站点RSS新闻正文抓取,导入discuz论坛,自动发帖的实现(三)
- 无法成功执行catalog.sql,ORA-04045 ORA-04064
- Spinner 显示SQLite
- Horizon的apache2启动时报错
- 搜索引擎入门(一)
- OCP-1Z0-053-V12.02-420题
- md5和sha1
- Linux使用AWK判断文件是否是windows格式的
- ubuntu终端sudo java提示“command not found”解决办法
- 换行符引发的血案
- iOS UIKit Dynamics 系列教程之Gravity+Collision
- linux 系统的库: xxx_dev 和 xxx的世界
- HDU 3419 水搜索