用Lucene创建索引
来源:互联网 发布:多益网络策划笔试题目 编辑:程序博客网 时间:2024/06/05 11:03
创建maven项目pom.xml文件
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>com.pactera</groupId> <artifactId>pactera-lucene</artifactId> <version>0.0.1-SNAPSHOT</version> <dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.10</version> </dependency> <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j-log4j12</artifactId> <version>1.6.4</version> </dependency> <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-core</artifactId> <version>4.10.2</version> </dependency> <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-analyzers-common</artifactId> <version>4.10.2</version> </dependency> <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-queryparser</artifactId> <version>4.10.2</version> </dependency> <dependency> <groupId>cn.itcast.lucene.analyzer</groupId> <artifactId>ik-analyzer</artifactId> <version>2012-4.x</version> </dependency> </dependencies></project>
测试
//测试创建索引 @Test public void testIndexWriter() throws IOException{ //创建索引目录 Directory directory = FSDirectory.open(new File("d:\\directory")); //创建标准分词器 Analyzer analyzer = new StandardAnalyzer(); //索引配置 IndexWriterConfig indexWriterConfig = new IndexWriterConfig(Version.LUCENE_4_10_2, analyzer); indexWriterConfig.setOpenMode(OpenMode.CREATE); //写索引 IndexWriter indexWriter = new IndexWriter(directory,indexWriterConfig); //创建文档对象 Document doc = new Document(); doc.add(new IntField("id", 18, Store.YES)); doc.add(new TextField("title", "我们都是党的接班人yes or no?", Store.YES)); doc.add(new LongField("price", 6388L, Store.YES)); doc.add(new StringField("pic", "www.baidu.com", Store.YES)); //添加文档 indexWriter.addDocument(doc); indexWriter.commit(); indexWriter.close(); }
在指定索引目录下查看索引
这种文件可以通过两种方式查看
第一种使用工具
用工具打开指定的目录就可以看到是怎么创建索引的
使用标准分词器汉字按单个字全部被拆分了
用lucene提供的TokenStream查看
@Test public void testTokenStream() throws IOException{ //创建标准分词器 Analyzer analyzer = new StandardAnalyzer(); //词汇列表 TokenStream tokenStream = analyzer.tokenStream("title", "我们都是党的接班人yes or no?"); //tokenStream指针指向开始位置 tokenStream.reset(); //设置分词偏移量引用 OffsetAttribute offsetAttribute = tokenStream.addAttribute(OffsetAttribute.class); //设置分词词语引用 CharTermAttribute charTermAttribute = tokenStream.addAttribute(CharTermAttribute.class); //遍历词汇列表 while(tokenStream.incrementToken()){ //分词开始位置 System.out.println("分词开始位置:" + offsetAttribute.startOffset()); //分词词语 System.out.println("最小分词单元:" + charTermAttribute); //分词结束位置 System.out.println("分词结束位置:" + offsetAttribute.endOffset()); } }
结果
0 0
- 用Lucene创建索引
- lucene学习----创建索引
- lucene创建索引
- Java_ABC_3.Lucene创建索引
- Lucene 索引创建
- LUCENE创建索引【鸡蛋】
- Lucene 索引创建
- lucene--创建索引,搜索
- lucene创建索引
- Lucene 4.4 创建索引
- Lucene.Net创建索引
- lucene 索引创建查询
- Lucene 索引创建 .
- lucene创建索引
- lucene 创建索引
- Lucene之创建索引
- Lucene创建空索引
- Lucene-索引创建&搜索
- 浅谈如何获得布局对象
- 37.数字在排序数组中出现的次数
- 两种常用的字符串的比较方法
- Python3如何支持中文
- js学习之javascript引用类型object--练习模拟Map和数组去重
- 用Lucene创建索引
- [LeetCode]104. Maximum Depth of Binary Tree
- JSP+Servlet实现简单的用户登录注册
- Python中的super用法详解
- 漫谈cup、硬盘、内存和指针的关系
- leetcode_9. Palindrome Number
- 常用排序方法代码
- Java命令打包的依赖libs的解决
- hadoop数据上传hdfs出错