Hadoop下进行反向索引(Inverted Index)操作
来源:互联网 发布:李健老婆孟小蓓 知乎 编辑:程序博客网 时间:2024/05/29 09:13
参考资料:
代码参考1:http://www.pudn.com/downloads212/sourcecode/unix_linux/detail999273.html
理论参考2:http://zhangyu8374.javaeye.com/blog/86307,http://nything.javaeye.com/blog/411787
在eclipse下创建map/reduce项目InvertedIndex,然后将参考1中的src目录拷贝到项目目录下替换原有src目录。
在本地创建文件夹IndexTest并在里面创建3个文件,每个文件中的内容如下。
* T0 = "it is what it is"
* T1 = "what is it"
* T2 = "it is a banana"
其中T0,T1,T2分别是文件名,后面为文件内容。将IndexTest文件夹上传到DFS中。然后运行反向索引程序。
最后输出结果为:
a (T2, 3)
banana (T2, 4)
is (T2, 2) (T0, 2) (T0, 5) (T1, 2)
it (T1, 3) (T2, 1) (T0, 1) (T0, 4)
what (T0, 3) (T1, 1)
代码清单:
InvertedIndex.java
TokenInputFormat.java
ValuePair.java
- Hadoop下进行反向索引(Inverted Index)操作
- Hadoop下进行反向索引(Inverted Index)操作
- 反向索引(Inverted Index)
- 反向索引(Inverted Index)
- 搜索引擎技术之反向索引设计(inverted index):
- 倒排索引(Inverted index)
- 倒排索引(Inverted Index)
- 倒排索引(Inverted File Index )
- Inverted Index(倒排索引)
- Inverted Index
- Inverted Index
- Lucene Inverted index(倒排索引)原来快速入门
- 倒排文件索引(Inverted File Index)的建立
- 倒排文件索引(Inverted File Index)的建立
- 倒排文件索引(Inverted File Index)的建立
- 倒排文件索引(Inverted File Index)的建立
- 倒排文件索引(Inverted File Index)的建立
- Lucene Inverted index(倒排索引)原来快速入门
- struct stat 的用法
- MediaScannerReceiver
- linux 下的文件操作
- ubuntu 提示no such device grub rescue> 的解决方法,简单
- SharePoint Filtered Lookup Column in a List[Sharepoint过滤选项字段,无代码]
- Hadoop下进行反向索引(Inverted Index)操作
- Java语法总结 - 内部类
- 就这么进来了
- java分布式通信系统(J2EE分布式服务器架构)
- 新手加入
- 收藏的关于博客园网站(增加中)
- UV
- 我看风寒感冒和风热感冒
- 用CodeViz产生函数调用图