有关lucene 索引pdf格式文档的问题
来源:互联网 发布:java编程艺术 编辑:程序博客网 时间:2024/06/05 07:57
环境: lucene2.0+pdf.0.7.3+je-analysis-1.4.0.jar+eclipse3.2
//索引文档LuceneInActionCH.pdf
File indexDir = new File("C://index"); // 索引文件存放路径
File dataDir = new File("C://file"); // 文件所存路径
Analyzer analyzer = new MMAnalyzer();
IndexWriter writer = new IndexWriter(indexDir, analyzer, true);
Document doc = LucenePDFDocument.getDocument(new File("C://file//LuceneInActionCH.pdf"));
writer.close();
索引是成功生成,索引文件_1.cfs大小18k.
//查询
QueryParser queryParser = null;
Query query = null;
IndexSearcher indexSearcher = null;
Hits hits = null;
String queryStr = null;
queryParser = new QueryParser("contents", new MMAnalyzer());
queryStr = "使用";
query = queryParser.parse(queryStr);
indexSearcher = new IndexSearcher("c://index");
hits = indexSearcher.search(query);
但查询不到结果,hits.length=0
请问高人,这可能是什么原因造成的?紧急,谢谢!
//索引文档LuceneInActionCH.pdf
File indexDir = new File("C://index"); // 索引文件存放路径
File dataDir = new File("C://file"); // 文件所存路径
Analyzer analyzer = new MMAnalyzer();
IndexWriter writer = new IndexWriter(indexDir, analyzer, true);
Document doc = LucenePDFDocument.getDocument(new File("C://file//LuceneInActionCH.pdf"));
writer.close();
索引是成功生成,索引文件_1.cfs大小18k.
//查询
QueryParser queryParser = null;
Query query = null;
IndexSearcher indexSearcher = null;
Hits hits = null;
String queryStr = null;
queryParser = new QueryParser("contents", new MMAnalyzer());
queryStr = "使用";
query = queryParser.parse(queryStr);
indexSearcher = new IndexSearcher("c://index");
hits = indexSearcher.search(query);
但查询不到结果,hits.length=0
请问高人,这可能是什么原因造成的?紧急,谢谢!
- 有关lucene 索引pdf格式文档的问题
- 有关Lucene的问题(8):用Lucene构建实时索引的文档更新问题
- 有关Lucene的问题(8):用Lucene构建实时索引的文档更新问题
- 有关Lucene的问题(8):用Lucene构建实时索引的文档更新问题
- 有关Lucene的问题(8):用Lucene构建实时索引的文档更新问题
- 有关Lucene的问题(8):用Lucene构建实时索引的文档更新问题
- 有关Lucene的问题:用Lucene构建实时索引
- 有关Lucene的问题:用Lucene构建实时索引
- Java Lucene (5):索引PDF文档
- 有关Lucene的问题(7):用Lucene构建实时的索引
- 有关Lucene的问题(7):用Lucene构建实时的索引
- 用Lucene构建实时索引的文档更新问题
- 用Lucene构建实时索引的文档更新问题
- 有关Lucene的问题(4):影响Lucene对文档打分的四种方式
- 有关Lucene的问题(4):影响Lucene对文档打分的四种方式
- 有关Lucene的问题(4):影响Lucene对文档打分的四种方式
- 有关Lucene的问题(4):影响Lucene对文档打分的四种方式
- lucene 索引非txt文档 (pdf word rtf html xml)
- MSComm串行通讯控件----2进制发送、接收数据(网上转载)
- lucene索引word/pdf/html/txt文件及检索(搜索引擎)
- PDFBox下载及将pdf提取转换为txt文档
- 随笔 1
- C#创建数字证书并导出为pfx,并使用pfx进行非对称加解密
- 有关lucene 索引pdf格式文档的问题
- JFreeChart 实例(原创)
- ActiveX、OLE和COM/DCOM区别解释
- sql 解释带分割符的字符串
- 个人常用word技巧----平时编辑word能快不少~
- VNI-2015 : 目标节点的节点首选身份证明无效
- Scrum 开发模式失败案例总结(待续)
- JFreeChart 一个曲线的实例
- gridview超链接列链接方法