分布式搜索引擎介绍(一)
来源:互联网 发布:调整手机字体大小软件 编辑:程序博客网 时间:2024/04/30 15:28
Google就是典型的分布式搜索引擎,它由上万台计算机组成。下面主要讲一下分布式搜索引擎的核心问题以及主要的分布式搜索引擎设计方法。
分布式搜索引擎的最主要的核心问题:
(1)分布的信息获取和计算,以及对此进行的数据统一;
这里面包括爬虫或者相应的数据获取机制的分布,对信息进行加工的统一管理。
(2)数据处理后的分布存储和管理;
主要是文件的准确定位和更新、增加、删除、移动的机制。
(3)前端搜索服务的分布。
主要处理大规模并发请求的分布机制。
针对以上的3个需求,可以设计如下的4类分布式搜索引擎:
(1)分布式元搜索引擎
(2)散列式分布搜索引擎
(3)P2P分布式搜索引擎
(4)局部遍历型搜索引擎
下面的文章会逐一介绍。
参考:《搜索引擎 原理、实践与应用》(卢亮、张博文编著)
0 0
- 分布式搜索引擎介绍(一)
- 初识分布式搜索引擎Elasticsearch(一)
- 分布式系统(一)分布式系统介绍
- 分布式搜索引擎ElasticSearch 介绍与简介
- java中的分布式应用(一)之分布式介绍
- 搜索引擎(四)-- 分布式爬虫
- 分布式搜索引擎
- 搜索引擎探究(一)
- 搜索引擎入门(一)
- 搜索引擎(一):基本知识
- 搜索引擎(一)-- 初识
- 搜索引擎比较(一)
- 分布式版本控制系统Mercurial(一):Mercurial基本功能介绍
- Gearman分布式任务处理系统(一)基本介绍
- 搜索引擎学习(一):搜索引擎学习
- 基于Dubbo的分布式系统架构(一)-分布式系统架构介绍
- 搜索引擎介绍
- 搜索引擎介绍
- C动态非连续数组
- 开放数据处理服务ODPS
- 常用iOS URL Scheme附录
- HDOJ 3788 ZOJ问题 (字符串)
- Linux下gdb使用入门
- 分布式搜索引擎介绍(一)
- C++里的运算符重载
- index
- Codewars练习:Ruby中的ceil与floor
- uva 1017 - Merrily, We Roll Along!(几何线性轮廓)
- namespace std
- wxhl ios bj 49期 张浩 学习心得体会文章连载 第六章
- js 动态时间代码
- UVA - 10600 ACM Contest and Blackout(次小生成树)