对Lucene PhraseQuery的slop的理解(转载)
来源:互联网 发布:淘宝宝贝展现量怎么看 编辑:程序博客网 时间:2024/06/05 06:13
所谓PhraseQuery,就是通过短语来检索,比如我想查“big car”这个短语,那么如果待匹配的document的指定项里包含了"big car"这个短语,这个document就算匹配成功。可如果待匹配的句子里包含的是“big black car”,那么就无法匹配成功了,如果也想让这个匹配,就需要设定slop,先给出slop的概念:slop是指两个项的位置之间允许的最大间隔距离,下面我举例来解释:
我的待匹配的句子是:the quick brown fox jumped over the lazy dog.
例1: 如果我想用“quick fox”来匹配出上面的句子,我发现原句里是quick [brown] fox,就是说和我的“quick fox”中间相差了一个单词的距离,所以,我这里把slop设为1,表示quick和fox这两项之间最大可以允许有一个单词的间隔,这样所有“quick [***] fox”就都可以被匹配出来了。
例2:如果我想用“fox quick”来匹配出上面的句子,这也是可以的,不过比例1要麻烦,我们需要看把“fox quick”怎么移动能形成“quick [***] fox”,如下表所示,把fox向右移动3次即可:
例3:如果我想用“lazy jumped quick”该如何匹配上面的句子呢?这个比例2还要麻烦,我们要考虑3个单词,不管多少个单词,slop表示的是间隔的最大距离,详细起见,我们分别来看每种组合:(我的待匹配的句子是:the quick brown fox jumped over the lazy dog.)
- lazy jumped:原句是jumped [over] [the] lazy,就是说它们两个之间间隔了2个词,如下所示:需要把lazy向右移动4位
lazyjumped 1 lazy|jumped 2 jumpedlazy 3 jumped lazy 4 jumped lazy
- lazy jumped quick:我们主要看lazy和quick,但是由于jumped是在中间,所以移动的时候还是要把jumped考虑在内,原句里lazy和quick的关系是:quick [brown] [fox] [jumped] [over] [the] lazy ,quick lazy中间间隔了5个词,所以如下图所示,把lazy向右移动8次
jumped
quick1
lazy|jumped
quick
2
jumped
lazy|quick
3
jumped
quick
lazy
4
jumped
quick
lazy
5
jumped
quick
lazy
6
jumped
quick
lazy
7
jumped
quick
lazy
8
jumped
quick
lazy
- 最后是jumped qucik,这里不详细画表格了,大家可以自己试试,应该是把jumped向右移动4次。
综合以上3种情况,所以我们需要把slop设为8才令“lazy jumped quick”可以匹配到原句。
- 对Lucene PhraseQuery的slop的理解(转载)
- 对Lucene PhraseQuery的slop的理解(转载)
- 对Lucene PhraseQuery的slop的理解
- 对Lucene PhraseQuery的slop的理解
- PhraseQuery slop
- lucene使用PhraseQuery设置slop进行短语查询
- PhraseQuery的分析
- firtex的phrasequery问题
- Lucene:PhraseQuery查询
- 对锁的理解(转载)
- Lucene2.4之PhraseQuery的用法
- lucene-PhraseQuery通过短语查询
- 对lucene的一些关键类方法理解
- 对Session和Cookie的理解(转载)
- 对facedetection程序的理解 --转载
- 对/proc/buddyinfo的理解(转载)
- 好文转载:对_stdcall 的理解
- 对ToString("X2 ")的理解(原文转载)
- LeetCode-Validate Binary Search Tree
- 窗体的Resize事件,Load事件如何添加
- SSH:Hibernate log4j与自定义版本冲突问题
- 文件管理
- sed命令使用
- 对Lucene PhraseQuery的slop的理解(转载)
- 卸载Xcode
- 由于高度的原因,霍雨浩只觉得面前一片
- 关于Windows通过远程桌面访问Ubuntu
- Windows下配置Django 1.6+apache+mod_wsgi
- SelectedIndexChanged事件, SelectedValueChanged事件和SelectionChangeCommitted事件的区别及应用
- VC6.0 快捷键整理
- 安卓基础小知识汇总
- UIImage图片部分拉伸