基于hadoop搜索引擎实践——在线处理（六）

来源：互联网发布：sql统计小计合计查询编辑：程序博客网时间：2024/05/22 00:48

基于hadoop搜索引擎实践——在线处理

这部分主要实现的是用户从前台输入查询请求，后台对这些请求进行查询和合并，最后前台显示结果信息的过程。

本系统实现使用jsp,服务器为tomcat6.0,具体页面实现这边不再讲述，主要讲述的是后台处理。当后台获取到需要查询的信息时，把这些信息进行分词，然后对每个关键词从倒排索引文件中获取各自MULTI_INFO,然后从所有关键词中的MULTI_INFO中求并具有相同DID的SINGLE_INFO,合并的方式是，Rank值相加，Position相拼接（可暂时忽略）。经过上述合并后可生成的结果集为最终的显示结果。用户观察到的过程如下图1-1，1-2

图1-1 输入查询请求

图1-2最后结果显示

具体实现代码可以查看：

离线处理程序：http://download.csdn.net/detail/long1657/8059593

在线处理程序：http://download.csdn.net/detail/long1657/8059567

参考文献：

1.刘鹏，hadoop实战，电子工业出版社，2011.9

0 0