基于hadoop搜索引擎实践——在线处理(六)
来源:互联网 发布:sql统计小计合计查询 编辑:程序博客网 时间:2024/05/22 00:48
基于hadoop搜索引擎实践——在线处理
这部分主要实现的是用户从前台输入查询请求,后台对这些请求进行查询和合并,最后前台显示结果信息的过程。
本系统实现使用jsp,服务器为tomcat6.0,具体页面实现这边不再讲述,主要讲述的是后台处理。当后台获取到需要查询的信息时,把这些信息进行分词,然后对每个关键词从倒排索引文件中获取各自MULTI_INFO,然后从所有关键词中的MULTI_INFO中求并具有相同DID的SINGLE_INFO,合并的方式是,Rank值相加,Position相拼接(可暂时忽略)。经过上述合并后可生成的结果集为最终的显示结果。用户观察到的过程如下图1-1,1-2
图1-1 输入查询请求
图1-2最后结果显示
具体实现代码可以查看:
离线处理程序:http://download.csdn.net/detail/long1657/8059593
在线处理程序:http://download.csdn.net/detail/long1657/8059567
参考文献:
1.刘鹏,hadoop实战,电子工业出版社,2011.9
0 0
- 基于hadoop搜索引擎实践——在线处理(六)
- 基于hadoop搜索引擎实践——总体概述(一)
- 基于hadoop搜索引擎实践——总体概述(一)
- 基于hadoop搜索引擎实践——网页爬取(二)
- 基于hadoop搜索引擎实践——生成倒排表文件(三)
- 基于hadoop搜索引擎实践——生成倒排表文件(四)
- 基于hadoop搜索引擎实践——二级索引文件(五)
- 基于hadoop搜索引擎实践——网页爬取(二)
- 基于hadoop搜索引擎实践——生成倒排表文件(四)
- 基于Hadoop生态圈的数据仓库实践 —— 进阶技术(六)
- 基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化(六)
- 基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化(六)
- 设计模式讲解与代码实践(六)——适配器(基于类)
- 基于Hadoop生态圈的数据仓库实践 —— 目录
- 基于Hadoop生态圈的数据仓库实践 —— ETL
- hadoop和hive的实践应用(二)——基于Hadoop的数据仓库工具hive搭建
- 基于Hadoop生态圈的数据仓库实践 —— 概述(一)
- 基于Hadoop生态圈的数据仓库实践 —— 概述(二)
- hybris学习笔记:Trail ~ Populating the Data Model
- freeswitch 使用外部directory 动态加载配置信息 2
- 【巧模拟】#75 A. Chips
- JAVA学习第5篇:JAVA编译器对比
- 关于AFNetworking 类库的一般用法
- 基于hadoop搜索引擎实践——在线处理(六)
- Domino函件收集器的配置及用法
- Jenkins入门总结
- 2dx3.2 创建项目
- HDU COMPUTER
- FMSC 使用理解
- 新入行程序员须知的8件事
- VeriSign官方域名被挂博彩
- 用userdata和localstorage做跨浏览器本地储存