基于hadoop搜索引擎实践——在线处理(六)

来源:互联网 发布:sql统计小计合计查询 编辑:程序博客网 时间:2024/05/22 00:48
基于hadoop搜索引擎实践——在线处理
    这部分主要实现的是用户从前台输入查询请求,后台对这些请求进行查询和合并,最后前台显示结果信息的过程。
    本系统实现使用jsp,服务器为tomcat6.0,具体页面实现这边不再讲述,主要讲述的是后台处理。当后台获取到需要查询的信息时,把这些信息进行分词,然后对每个关键词从倒排索引文件中获取各自MULTI_INFO,然后从所有关键词中的MULTI_INFO中求并具有相同DID的SINGLE_INFO,合并的方式是,Rank值相加,Position相拼接(可暂时忽略)。经过上述合并后可生成的结果集为最终的显示结果。用户观察到的过程如下图1-1,1-2

图1-1 输入查询请求

图1-2最后结果显示
    具体实现代码可以查看:
    离线处理程序:http://download.csdn.net/detail/long1657/8059593
    在线处理程序:http://download.csdn.net/detail/long1657/8059567
参考文献:
1.刘鹏,hadoop实战,电子工业出版社,2011.9
0 0
原创粉丝点击