Hadoop概述

来源:互联网 发布:linux 传文件命令 编辑:程序博客网 时间:2024/04/27 05:18
Hadoop的历史:

1.Apache Lucene

》全球第一个开源的全文检索引擎工具包

》完整的查询引擎和索引引擎

》部分文本分析引擎

》开发人员可在此基础建立起完整的全文检索引擎

2.Nutch

》开源的的基于Lucene的网页搜索引擎

》加入网页抓取、解析等功能

》类似于Google等商业搜索引擎

Google的两篇重要论文:

》Google File System

》MapReduce架构:Simplified Data Processing on Large Clusters

 Hadoop官网:http://hadoop.apache.org
0 0
原创粉丝点击