lucene学习日志(一)
来源:互联网 发布:淘宝旺旺头像 编辑:程序博客网 时间:2024/06/05 20:06
由于实际需求,小小兵我最近对搜索引擎和网络爬虫产生了浓烈的兴趣,决定自己先写个网络爬虫试试,说不定以后在网上找资源就可以用得上了。小小兵真的是觉得手动在百度和google上找资源效率很低,再者,写个爬虫,这个逼可以吹一年,哈哈。
首先是环境的搭建,由于我是用java来做的,所以用eclipse来写,去http://archive.apache.org/dist/lucene/java/ 去这个地址把架包下载好,然后导好包,环境就算搭建好啦。先写一个测试例子。以下贴出我的代码:
package test.lucene;
import java.io.IOException;
import java.io.StringReader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
public class TestLucene {
public static void main(String[] args) throws IOException {
Analyzer analyzer = new StandardAnalyzer();
TokenStream tokenStream = analyzer.tokenStream("", new StringReader("this is the first lucene test java project"));
Token token = new Token();
while(tokenStream.next(token) != null)
System.out.println(token.term());
}
}
运行结果如下:
由于lucene把this is 这种虚词裁剪掉了,留下来的都是一些关键词,所以才会剪切成这几个单词。
好了,今天先到这了。
- lucene学习日志(一)
- lucene学习(一)
- Lucene学习(一)
- Lucene学习(一)
- Lucene学习笔记(一)-------Lucene基础
- Lucene学习笔记(一)
- Lucene 3.0 学习(一)
- Lucene学习总计(一)
- lucene学习笔记(一)
- Lucene学习笔记(一)
- lucene学习记录(一)--lucene demo的学习
- Lucene全文检索学习笔记(一):lucene的应用
- Lucene学习-创建索引(一)
- Lucene+Heritrix学习笔记系列(一)
- Lucene/Solr学习笔记(一)
- Lucene 学习(一):简单demo
- Lucene全文搜索学习笔记(一)
- lucene学习笔记(一)简介
- [BZOJ2342][Shoi2011]双倍回文(manacher)
- iOS开发中,Your session has expired. Please log in.
- 11.文件与文件系统的压缩与打包
- Shell—输入/输出重定向
- 结构、联合、位字段、枚举
- lucene学习日志(一)
- 千分位格式化,并保留两位小数
- Java序列化技术性能分析(JDK原生与Protostuff)
- C 结构体与共用体的用法
- jQuery笔记——工具函数——缓存
- 6--QT 创建主窗口MainWindow
- 初识Spring Boot框架(二)之DIY一个Spring Boot的自动配置
- [BZOJ2160]拉拉队排练(manacher+快速幂)
- 深入理解Java虚拟机:运行时数据区域