Lucene学习笔记(2)(竹笋炒肉)
来源:互联网 发布:人人商城v2 源码 编辑:程序博客网 时间:2024/05/17 02:04
Lucene学习笔记(2)
不仅仅在推广和介绍方面,车东在Lucene的汉化及web应用,也作出了极大的极大的贡献。他将自己的汉化和web应用两方面的成果,放在sourceforge上成了开源的项目。下面主要是对这个项目的学习笔记。
对Lucene的汉化,车东开发了两个Analyzer,一个是二元切分,一个单字切分。利用这两个中的任一个进行分析,都可以进行汉字的索引和检索了。我把这两个Analyzer编译后一起打入到lucene-1.2.jar中了,如果不愿自己动手进行编译这两个Analyzer的朋友,可以从这儿下载。
有了新的Analyzer,我把IndexFiles、IndexHTML和SearchFiles中的Analyzer也用了新CJKAnalyzer做了替换,并重新编译打了包lucene-demo-1.2.jar,可以从这儿下载。包内带有修改后的三个java文件。
用上面两个jar文件,分别替换同名的原来的文件,就可以索引和检索汉语了。右面是我做的测试。
- Lucene学习笔记(2)(竹笋炒肉)
- Lucene学习笔记(3)(竹笋炒肉)
- Lucene学习笔记(1)(来自:竹笋炒肉)
- 竹笋炒肉的cocoon学习笔记
- 竹笋炒肉: Jmagick学习笔记
- 竹笋炒肉转载 -- 读《Effective java 中文版》(2)
- 竹笋炒肉转载 -- 读《Effective java 中文版》(1)
- 竹笋炒肉转载 -- 读《Effective java 中文版》(3)
- 竹笋炒肉转载 -- 读《Effective java 中文版》(4)
- 竹笋炒肉转载 -- 读《Effective java 中文版》(5)
- TrackBack新手指南(编译)--转自竹笋炒肉
- Lucene学习笔记(2)
- Lucene学习笔记(1)-Hello Lucene
- Lucene学习笔记(一)-------Lucene基础
- Lucene.NET学习笔记(2)
- Lucene学习笔记(一)
- lucene学习笔记(一)
- Lucene学习笔记(1)
- 你会打电话吗
- VB程序实现WindowsXP效果的界面------选择自 cuizm 的 Blog
- blog里的编辑器是垃圾 ,超级垃圾 。 。 。
- 微软的站点搜索引擎内幕 (zt)
- Lucene学习笔记(3)(竹笋炒肉)
- Lucene学习笔记(2)(竹笋炒肉)
- 唐敏:中国软件困境在软件工程薄弱
- Lucene学习笔记(1)(来自:竹笋炒肉)
- wereew
- 运行OpenLdap
- 用API修改注册表的完整模块 选择自 goodname008 的 Blog
- 杨振宁:凭什么要大家尊重你?
- 一个绝对经典的在VB中操作.ini文件的通用类源代码 选择自 goj2000 的 Blog
- 目录服务中LDAP的基本模型