Lucene2.3的变化日志

来源:互联网 发布:深圳市阿里云大厦饺子 编辑:程序博客网 时间:2024/04/29 01:46
 
Lucene的变化日志元身分元 =======================释放2.3.0 2008年1月23日================== ===== 变化在运行时的行为  1 。 Lucene的- 994 :默认为indexwriter已被更改,以最大限度地    出先进的系统盒索引速度。首先, indexwriter现在冲所     RAM的使用量( 16 MB的默认) ,而不是一个固定的文件计数(呼叫     indexwriter.setmaxbuffereddocs获得向后兼容    行为) 。第二, concurrentmergescheduler是用于运行合并    利用后台线程(呼叫indexwriter.setmergescheduler (新     serialmergescheduler ( ) ) ,以获得向后兼容行为) 。     第三,并购是选择的基础上的规模字节的每一部分    而非文件计数的每一部分(呼叫     indexwriter.setmergepolicy (新logdocmergepolicy ( ) ) ,以获得    向后兼容行为) 。     注:用户parallelreader必须改变回所有这些    拖欠,以确保docids "对齐" ,所有并行    指数。      (迈克mccandless )   2 。 Lucene的-在1045 : sortfield.auto没有工作,与长。当检测    外地类型自动排序,有多少曾经被    解释为诠释,那么,作为自由浮动,如果解析人数作为诠释    失败了。现在的检测检验诠释,那么,时间不长,     然后浮法。 (丹尼尔纳贝尔) 空气污染指数的变化  1 。 Lucene的- 843 :补充indexwriter.setrambuffersizemb (...)有     indexwriter冲水每当缓冲文件,多用    超过规定数额的RAM 。还增加了新的宣传短片,以象征性    它们允许一个确定一个烧焦[ ]加偏移和长度指定    令牌(以避免创造一个新的字符串( ) ,为每一个令牌) 。 (迈克     mccandless )   2 。 Lucene的- 963 :添加二传手到外地,让重新使用一个单一的    外地例如,在索引。这是一个可观的业绩    增益,特别是对小文件。 (迈克mccandless )   3 。 Lucene的- 969 :添加新的API道理, tokenstream和分析仪    证重新使用的令牌和tokenstream事例在    索引。改变心意用炭[ ]作为存储为     termtext而不是字符串。这使更快tokenization     表演( 〜 10-15 % ) 。 (迈克mccandless )   4 。 Lucene的- 847 :意料之中mergepolicy的,这就决定了兼并    应采取的地点和时,以及mergescheduler ,     决定何时选定合并应实际运作,但出于     indexwriter 。默认合并政策现     logbytesizemergepolicy (见Lucene的- 845 )和预设合并    调度器是现在concurrentmergescheduler (见     Lucene的- 870 ) 。 (潘国加士透过麦克mccandless )   5 。 Lucene的- 1052 :添加indexreader.setterminfosindexdivisor ( int )的方法    可以让你减少记忆体使用的terminfos进一步    子采样(超过termindexinterval被用来在    索引) ,其中的条款,装载到内存中。 (夹头威廉姆斯,     道格切割透过麦克mccandless )       6 。 Lucene的- 743 :添加indexreader.reopen ( )的方法,重新打开    现有indexreader (见新的特点-> "八) (迈克尔布希公司)   7 。 Lucene的- 1062年:加入setdata (字节[ ]数据) ,      setdata (字节[ ]的数据,诠释抵消,诠释长度) , getdata ( ) , getoffset ( )     与克隆( )方法,以o.a.l.index.payload 。还添加字段名称    由于阿根廷以similarity.scorepayload ( ) 。 (迈克尔布希公司)   8 。 Lucene的- 982 :添加indexwriter.optimize ( int起点maxnumsegments )方法     "局部优化"的一个指标下降至maxnumsegments环节。      (迈克mccandless )   9 。 Lucene的- 1080 :改变token.default_type定为公。  10 。 Lucene的- 1064 :改变topdocs构造被公开。       (帅erera途经迈克尔布希公司)  11 。 Lucene的- 1079个: docvalues清理:构造器,现在已经没有params ,     和getinnerarray ( ) ,现在全unsupportedoperationexception (多伦科恩)  12 。 Lucene的- 1089 :补充priorityqueue.insertwithoverflow ,他返回    对象(如果有的话) ,这是相碰,从排队,让    重新使用。 (帅erera透过麦克mccandless )      13 。 Lucene的- 1101 :令牌重用'合同' (指Lucene的- 969 )     修改,以便它是象征性的生产者的责任    请token.clear ( ) 。 (多伦科恩)  14 。 Lucene的- 1118 :改变standardanalyzer跳过太龙(默认>      255个字符)令牌。你可以增加此限拨电话     standardanalyzer.setmaxtokenlength (...). (迈克尔mccandless )  bug修复  1 。 Lucene的- 933 : queryparser固定将不会产生空分     booleanqueries " ( ) " ,即使分析器产生任何    代币投入。 (多伦科恩)   2 。 Lucene的- 955 :固定segmenttermpositions工作正确与    第一任期在字典里。 (迈克尔布希公司)   3 。 Lucene的- 951 :固定nullpointerexception在multilevelskiplistreader     这是投掷后的呼唤termpositions.seek ( ) 。      (富有约翰逊途经迈克尔布希公司)       4 。 Lucene的- 938 :固定的情况下,一个unhandled例外     indexwriter的方法可能会导致删除,以丢失。      (潘国加士透过麦克mccandless )         5 。 Lucene的- 962 :固定的情况下,一个unhandled例外     indexwriter.adddocument或indexwriter.updatedocument可能导致     unreferenced档案,在该指数将不会被删除     (潘国加士透过麦克mccandless )     6 。 Lucene的- 957 : ramdirectory固定要妥善处理好目录    大于integer.max_value 。 (多伦科恩)   7 。 Lucene的- 781 : multireader固定,以不丢的NPE如果iscurrent ( ) ,      isoptimized ( )或getversion ( )被调用。失散multireader     分为两个档次: multisegmentreader延伸indexreader ,是    整套保护,并创造自动indexreader.open ( )     在情况下,指数有多个环节。市民multireader     现已扩展到multisegmentreader是打算用来用户    那些想增加他们自己的subreaders 。 (丹尼尔纳贝尔,迈克尔布希公司)   8 。 Lucene的- 970 : filterindexreader现在实行isoptimized ( ) 。前    打电话的isoptimized ( )会扔北角。 (迈克尔布希公司)   9 。 Lucene的- 832 : parallelreader固定,以不丢的NPE如果iscurrent ( ) ,      isoptimized ( )或getversion ( )被调用。 (迈克尔布希公司)        10 。 Lucene的- 948 :定位fnfe例外所造成的陈腐NFS的客户端    名录中暗藏当作家,在不同的机器上都    分享指数超过NFS和使用定制删除政策(迈克     mccandless )  11 。 Lucene的- 978 :确保terminfosreader , fieldsreader , fieldsreader     关闭任何溪流中,他们拓宽了,如果是一个例外,射中    构造方法。 (李宁透过麦克mccandless )  12 。 Lucene的- 985 :如果一个非常长远的,是在一个文件( " > 16383字)     我们现在抛出一个illegalargumentexception说一词,是太    长期以来,而不是潜arrayindexoutofboundsexception 。 (卡尔。      wettin透过麦克mccandless )  13 。 Lucene的- 991 :解释( )方法boostingtermquery有错误    当没有有效载荷人出席一份文件。 (彼得基冈经    金英格索兰)  14 。 Lucene的- 992 :固定indexwriter.updatedocument将原子再次     (这是打破Lucene的- 843 ) 。 (李宁透过麦克mccandless )  15 。 Lucene的- 1008 :固定腐败案文件时,没有任期    向量场是补充文件后,与长远的向量场。     这个bug提交与Lucene的- 843 。 (赠款英格索兰经    麦克mccandless )  16 。 Lucene的- 1006 :固定queryparser接受" , "外地值(零    长度引述弦) ( yonik )  17 。 Lucene的1010 :固定腐败案文件时,没有任期    向量场是补充文件后,与长远的向量场。     这件事的打击,合并,并会造成eofexception 。     这个bug提交与Lucene的- 984 。 (安迪vajda途经迈克     mccandless )  19 。 Lucene的- 1009 :定合并缓慢logbytesizemergepolicy时     autocommit =虚假和文件都是使用存储领域和/或任期    载体。 (马克米勒透过麦克mccandless )  20 。 Lucene的-第1011 :固定贪污案件时,两个或两个以上的机器,     分享指数超过NFS的,可作家接踵而来。      (帕特里克kimber透过麦克mccandless )  21 。 Lucene的- 1028 :固定重量,系列化,为几个疑问:      disjunctionmaxquery , valuesourcequery , customscorequery 。     连载核对补充,为所有疑问。      (凯尔麦克斯韦通过多伦科恩)  22 。 Lucene的- 1048 :固定不正确行为lock.obtain (...)当    超时说法是非常大的(如long.max_value ) 。还补充说:      lock.lock_obtain_wait_forever常数从来没有超时。 (尼古拉     diakov透过麦克mccandless )  23 。 Lucene的1050 :扔在lockreleasefailedexception     简单/ nativefslockfactory如果我们不能删除锁定文件时,     释放锁。 (尼古拉diakov透过麦克mccandless )  24 。 Lucene的-七一:固定segmentmerger正确一套有效载荷位    合并后部分。 (迈克尔布希公司)  25 。 Lucene的- 1042 :移除投掷的ioexception在gettermfreqvector ( int起点,弦乐, termvectormapper ) ,以保持一致    与其他gettermfreqvector来电。还取消了投掷的其他ioexception在这一方法是一致的。 (卡尔wettin途经金英格索兰)      26 。 Lucene的1096 :定额点击行为时,点击'文件被删除    随着迭代的命中目标。删去文档已经名词    现在工程无缝。如果文档尚未名词被删除     (例如:从另一个线程) ,然后,依靠初始     hits.length ( ) ,申请企图取回详情Hits     比实际存在的,一个concurrentmidificationexception     是抛出。 (多伦科恩)  27 。 Lucene的- 1068 :改变standardtokenizer向被告问题,它标志着  该类型的一些令牌错误。这样做增加了新的国旗命名   replaceinvalidacronym默认为虚假的,目前,不正确行为。设置  这个旗的真正修复这个问题。这个旗是一个临时的解决,并已  标记为已被废弃了。 3.x将实施正确的做法。 (帅erera途经金英格索兰)    Lucene的- 1140 :固定北角造成1068 (阿列克谢它的经批英格索兰)      28 。 Lucene的- 749 : chainedfilter行为时,固定的逻辑    首先过滤器是andnot 。 (安东尼奥布鲁诺途经多伦科恩)  29 。 Lucene的- 508 :确保segmenttermenum.prev ( )是准确的( =上    任期)后,明年( )返回false 。 (潘国tamm途经迈克     mccandless )     新功能  1 。 Lucene的- 906 : elision滤波器为法语。      (马丢勒卡尔姆途经奥的斯gospodnetic )   2 。 Lucene的- 960 :加了spanqueryfilter及相关班级,让    不仅过滤,但不知在一份文件,一个过滤火柴     (赠款英格索兰)   3 。 Lucene的- 868 :增加新的任期内向量接入功能。新的回调    机制允许应用以确定如何以及在哪里看长远    载体从磁盘。本实施包含几个扩展    根据新摘要termvectormapper阶层。新的空气污染指数应    回到兼容的。没有变化,在实际储存的任期载体    确已发生。   3.1 Lucene的- 1038年:增加setdocumentnumber ( )方法来termvectormapper      提供资料,有什么文件正在访问。       (卡尔wettin途经金英格索兰)   4 。 Lucene的- 975 :补充positionbasedtermvectormapper允许    立场基于查表的任期向量信息。     见项目编号3段( Lucene的- 868 ) 。   5 。 Lucene的-第1011 :新增简单工具(都在org.apache.lucene.store )     核实锁定工作正常。 lockverifyserver背道而驰    一个单独的服务器来验证门锁。 lockstresstest运行一个简单    工具,迅速获取和发布的门锁。      verifyinglockfactory是lockfactory即包裹任何其他     lockfactory和咨询lockverifyserver每当锁    取得或释放,抛出一个例外,如果一个非法锁    获得发生。 (帕特里克kimber透过麦克mccandless )   6 。 Lucene的- 1015 :补充fieldcache支线( extendedfieldcache )     支持双打和多头。补充支持,到sortfield整治方案    对双打和多头以及。 (赠款英格索兰)   7 。 Lucene的- 1020 :创造了基本指标检测与维修工具     ( o.a.l.index.checkindex ) 。在运行时没有固定,它不利于    详细测试的所有环节在指数和报告摘要    信息与任何错误,它击中。与修补,它会移除    部分曾错误。 (迈克mccandless )   8 。 Lucene的- 743 :添加indexreader.reopen ( )的方法,重新打开    现有indexreader只装载的那部分索引    这改变了自读者是(重新)举行开幕仪式。重开( ) ,可    大大快于开放式( ) ,视金额的    指数的变化。 segmentreader , multisegmentreader , multireader ,     和parallelreader落实重开( ) 。 (迈克尔布希公司)   9 。 Lucene的- 1040 : chararrayset有益的,以便有效地遏制    设籍的文本指明烧焦[ ] 。 ( yonik )  10 。 Lucene的- 1073 :创造snapshotdeletionpolicy ,以方便走    活备份的一个指标,没有停索引。 (迈克     mccandless )      11 。 Lucene的- 1019 : customscorequery加强,以支援多种     valuesource疑问。 (凯尔麦克斯韦通过多伦科恩)      12 。 Lucene的- 1095 :增加一个选择stopfilter增加     positionincrement的令牌接替暂停道理。     残疾人默认。类似的选项中加入queryparser     考虑象征性职位,当创建phrasequery     和multiphrasequery 。残疾人默认(所以默认    查询解析器忽略立场递增) 。      (多伦科恩)  优化  1 。 Lucene的- 937 : cachingtokenfilter如今采用迭代访问    令牌是缓存在linkedlist 。这都增加了业绩    显着的,尤其是当有多少筹码是大。      (马克米勒途经迈克尔布希公司)   2 。 Lucene的- 843 :大幅度优化,以改善如何indexwriter     使用内存为缓冲文件,并加速索引( 2倍- 8倍速    更快) 。一个单一的共享哈希表现记录在记忆体    每张贴独特的任期,并直接冲入成一个单一    部分。 (迈克mccandless )    3 。 Lucene的- 892 :固定额外的"缓冲区到缓冲区拷贝" ,有时候    发生时,使用复合文件。 (迈克mccandless )   4 。 Lucene的- 959 :移除同步文件( yonik )   5 。 Lucene的- 963 :添加二传手到外地,让重新使用一个单一的    外地例如,在索引。这是一个可观的业绩    增益,特别是对小文件。 (迈克mccandless )   6 。 Lucene的- 939 :检查明确为边界条件fieldinfos     和不依赖例外。 (迈克尔布希公司)   7 。 Lucene的- 966 :十分可观的加速比( 〜 6倍快)      standardtokenizer ( standardanalyzer )用jflex而非     javacc生成tokenizer 。      ( stanislaw奥辛斯基透过麦克mccandless )   8 。 Lucene的- 969 :改变核心tokenizers与滤波器,以重新使用,并象征性     tokenstream事例时,有可能改善tokenization     表演( 〜 10-15 % ) 。 (迈克mccandless )   9 。 Lucene的- 871 :加速isolatin1accentfilter (伊恩波士顿途经迈克     mccandless )  10 。 Lucene的- 986 : refactored segmentinfos从indexreader纳入新的    亚纲directoryindexreader 。 segmentreader和multisegmentreader     现在延长directoryindexreader是唯一indexreader     建置使用segmentinfos接入指数和    获得写锁,为指数的修改。 (迈克尔布希公司)  11 。 Lucene的- 1007 :请允许冲厕indexwriter可触发    要么RAM的用法或文件计数或两者(后者    第一) ,加上象征性不断disable_auto_flush禁用    其中的冲水诱因。 (李宁透过麦克mccandless )  12 。 Lucene的- 1043 :加快合并的存储领域,由散装抄袭    原料字节为每个连续的一系列非删除文件。      (罗伯特恩格斯通过麦克mccandless )  13 。 Lucene的- 693 :加快嵌套连词( 〜 2倍) ,那场比赛有很多    文件,并有轻微的性能提升,为高层    连接词。 ( yonik )  14 。 Lucene的- 1098 :内部类standardanalyzer.savedstreams静    为最终决定。 (弥敦道beyer途经迈克尔布希公司) 文件  1 。 Lucene的- 1051 :生成单独的Javadoc核心,演示和contrib请    班,以及作为一个统一的看法。同时添加适当的菜单    结构,以该网站。 (迈克尔布希公司)   2 。 Lucene的- 746 :定位错误讯息,在analyzingqueryparser.getprefixquery 。      (柏霆科勒赫迈宁途经迈克尔布希公司) 建设  1 。 Lucene的- 908 :改进和简化为如何体现    档案和梅塔-干扰素迪尔创造。 (迈克尔布希公司)   2 。 Lucene的- 935 :各项改善工作,为行家文物。现在    文物,还包括来源。 JAR文件。 (迈克尔布希公司)   3 。补充申请-贴片目标,以高层建。默认为寻找    补丁程序,在$ ( basedir }/../补丁名称指明- dpatch.name 。     还可以指定在任何地点- dpatch.file财产上的指挥    线。这应该是有帮助的,方便适用的补丁,但它    也是迈向整合自动贴片与应用    几种和Hudson ,因此,这是可能随时变动。 (赠款英格索兰)    4 。 Lucene的- 935 :界定财产" m2.repository.url " ,让定    该网址向行家远端部署。 (迈克尔布希公司)   5 。 Lucene的- 1051 :包含的Javadoc在行家文物。 (迈克尔布希公司)   6 。 Lucene的- 1055 :移除gdata服务器,从建立档案及其来源    从躯干。 (迈克尔布希公司)   7 。 Lucene的- 935 :首先,请允许部署行家文物到一个偏远的货币供应量M2存放处    途经的SCP和SSH认证。 (迈克尔布希公司)    8 。 Lucene的- 1123年:首先,请允许压倒一切的规格版本     manifest.mf (迈克尔布希公司) 测试案例  1 。 Lucene的- 766 :测试,加入这两个领域与同名同姓,但不同    任期向量设置。 (尼可拉斯lalevée途经多伦科恩)      =======================释放2.2.0 2007-06-19 ================== ===== 变化在运行时的行为空气污染指数的变化  1 。 Lucene的- 793 :创造了新的例外和补充,他们投掷第    对于许多方法(所有子ioexception为倒退    兼容性) : index.stalereaderexception ,      index.corruptindexexception , store.lockobtainfailedexception 。     这样做的目的是更好地呼吁找出可行的根源,是一个     ioexception从这些方法。 (迈克mccandless )   2 。 Lucene的- 811 :珍爱segmentinfos一流的,再加上几个方法,由相关    班,包私人再次(他们不必要公开    由于部分Lucene的- 701 ) 。 (迈克mccandless )   3 。 Lucene的- 710 :增加可选autocommit布尔以indexwriter     建设者。如果这是假的,指数变化不承诺    直到作家收盘。这给了明确的控制时,     读者将会看到的变化。还增加了可选的定制    删除政策,以明确控制的时候,事先承诺是    清除出指数。这是为了让申请    股票指数超过安装NFS定制时,事先承诺是    删除。 (迈克mccandless )   4 。 Lucene的- 818 :改变了大多数公共方法indexwriter ,      indexreader (及其子类) , fieldsreader和ramdirectory至    扔alreadyclosedexception如果他们进入后,     封闭。 (迈克mccandless )   5 。 Lucene的- 834 :改变了一些市场准入水平,为某些跨度班,让他们有    被否决。他们已显着专家只,不为公众    消费。 (赠款英格索兰)   6 。 Lucene的- 796 :除去通话超级.*来自各获得*查询方法     multifieldqueryparser ,为了让子班,以凌驾他们。      (潘国加士途经奥的斯gospodnetic )   7 。 Lucene的- 857 :清除缓存从queryfilter和废弃queryfilter     赞成querywrapperfilter或querywrapperfilter + cachingwrapperfilter     组合时,贮藏,是理想的。      (克里斯hostetter ,奥的斯gospodnetic )   8 。 Lucene的- 869 :改变fsindexinput和fsindexoutput向内蒙古班的fsdirectory     为了使可扩展性,这些班级。 (迈克尔布希公司)   9 。 Lucene的- 580 :新增公共方法复位( ) tokenstream 。这个方法    没有默认,但可能被覆盖由亚,以支持消费    该tokenstream一次以上。 (迈克尔布希公司)  10 。 Lucene的- 580 :增加了一个新的构造器,以现场即需tokenstream作为    论据,可作为tokenstreamvalue ( ) 。这是有益的,以避免必要的     "虚拟分析仪" ,为预分析领域的合作。 (卡尔wettin ,迈克尔布希公司)  11 。 Lucene的- 730 :增加了新的方法,以booleanquery setallowdocsoutoforder ( )      getallowdocsoutoforder ( ) 。已废弃的方法setusescorer14 ( )      getusescorer14 ( ) 。优化补丁Lucene的- 730 (见优化" -> 3 ) 。     提高性能为若干疑问,但结果得分列的docid     秩序。这个补丁扭转这种改变,因此,现在默认击中文档得分    在docid秩序,如果没有setallowdocsoutoforder (属实) ,是明确要求。     这个补丁也使测试queryutils再次检查docid     秩序。 (保罗elschot ,多伦科恩,迈克尔布希公司)  12 。 Lucene的- 888 :补充directory.openinput (文件路径,诠释buffersize )     以选择性地指定大小的读取缓冲区。还补充说:      bufferedindexinput.setbuffersize ( int )的改变缓冲区大小。      (迈克mccandless )  13 。 Lucene的- 923 :珍爱segmenttermpositionvector一揽子公私。它不需要    要公开,因为它实现了公共接口termpositionvector 。      (迈克尔布希公司)  bug修复  1 。 Lucene的- 804 :固定build.xml收拾一个完全compilable钢骨混凝土的dist 。 (多伦科恩)   2 。 Lucene的- 813 :领导通配符固定工作,与拖尾通配符。     单项查询修改,以创造一个前缀质疑只为案例    有一个单一的拖尾通配符(也没有额外的通配符    或'吗?在查询文本) 。 (多伦科恩)   3 。 Lucene的- 812 :添加无说法建设者以nativefslockfactory     和simplefslockfactory 。这使得所有4个内嵌式lockfactory     实现向指定经系统特性     org.apache.lucene.store.fsdirectorylockfactoryclass 。 (迈克mccandless )   4 。 Lucene的- 821 :新的单规范档案介绍Lucene的- 756     失败的次数减少了开放式叙词,因为它仍是    开每场的规范。 ( yonik )   5 。 Lucene的- 823 :确保内部文件句柄关闭时,     打一个例外(如磁盘全额) ,而冲厕删除,在     indexwriter的mergesegments ,也就是在     indexwriter.addindexes 。 (迈克mccandless )   6 。 Lucene的- 825 :如果目录中删除后,      fsdirectory.getdirectory ( ) ,但在此之前indexreader.open你现在得到     1 filenotfoundexception像Lucene的预2.1 (在此之前,整你    得到的NPE ) 。 (迈克mccandless )   7 。 Lucene的- 800 :除去反斜线从term_char清单中的queryparser ,     因为反斜线是逃避性格。也改变了escaped_char     这份名单包含所有可能的字符,因为每个字符    如下反斜线应被视为逃脱。 (迈克尔布希公司)   8 。 Lucene的- 372 : queryparser.parse ( )现在确保整个输入字符串    被消耗。现在parseexception是投掷如果一个查询包含太多    闭幕括号。 (安德烈亚斯诺依曼途经迈克尔布希公司)   9 。 Lucene的- 814 : javacc建设目标,现在定线端的作风,生成的文件。     现在还删去所有javacc生成的文件,然后javacc 。      (潘国加士,多伦科恩)      10 。 Lucene的- 829 :关闭读者在contrib请/基准。 (卡尔wettin ,多伦科恩)  11 。 Lucene的- 828 :轻微见效任期的平等( ) 。      (保罗Cowan先生途经奥的斯gospodnetic )  12 。 Lucene的- 846 :固定:如果indexwriter是启用autocommit =虚假的,     和您致电addindexes ,并触及一个例外(如磁盘全额) ,然后    当indexwriter回滚事务,其内部状态,这可能舞弊    实例indexwriter (但不是指数本身)     参照已删除的部分。这种小虫是目前唯一的    在2.2 (主干) ,即是永远不会释放。 (迈克mccandless )      13 。 Lucene的- 736 :马虎短语查询与重复计算,火柴错误文档。     例如查询"土著联昌银行的" 〜 2匹配文件" abcde " 。 (多伦科恩)      14 。 Lucene的- 789 :固定:自相似性是忽视了使用时multisearcher (问题报道    由阿列克谢龙) 。现在相似适用multisearcer.setsimilarity ( SIM卡)被使用。     注意,由于在此之前修复,创造一个multisearcher从搜索者为谁习俗相似    是一套没有任何影响-这是蒙面由相似的m ultisearcher。这是因为    设计的,因为multisearcher和经营searchables (不查册) 。 (多伦科恩)  15 。 Lucene的- 880 :固定documentwriter关闭tokenstreams后    最近写了帖子。那么,资源与     tokenstreams可以安全获得释放。 (迈克尔布希公司)  16 。 Lucene的- 883 :连续通话spellchecker.indexdictionary ( )     不会插入条款两次了。 (丹尼尔纳贝尔)  17 。 Lucene的- 881 : queryparser.escape ( ) ,现在也能逃出字     ' | '和' & ' ,其中有部分的queryparser语法。 (迈克尔布希公司)  18 。 Lucene的- 886 : spellchecker清理:例外的是没有印到stderr     再与忽视,但重新抛出异常。一些与JavaDoc改善。      (丹尼尔纳贝尔)  19 。 Lucene的- 698 : filteredquery现在需查询刺激到帐户    得分。 (迈克尔布希公司)  20 。 Lucene的- 763 : spellchecker : lucenedictionary用来跳过首字    枚举。 (基督教马尔维茨途经丹尼尔纳贝尔)      21 。 Lucene的- 903 : filteredquery解释,不准确的,与正面的影响。     解释测试,目前"深层次"的检查交代详情。      (克里斯hostetter ,多伦科恩)      22 。 Lucene的- 912 : disjunctionmaxscorer第一skipto (目标)呼叫漠视    跳过指标参数,并结束了,在第一场比赛。      ( sudaakeran乙途经克里斯hostetter &多伦科恩)      23 。 Lucene的- 913 :连续两次评分( )的调用会返回不同    分数为布尔疑问。 (迈克尔布希公司,多伦科恩)  24 。 Lucene的- 1013年:定位indexwriter.setmaxmergedocs工作"出的    盒" ,让我们再通过移动设置/ getmaxmergedocs从     logdocmergepolicy到logmergepolicy 。这个补丁空气污染指数    破损(非向后兼容的变化)所造成的Lucene的- 994 。      ( yonik斯利透过麦克mccandless ) 新功能  1 。 Lucene的- 759 :新增两个N克生产tokenfilters 。      (奥的斯gospodnetic )   2 。 Lucene的- 822 :补充fieldselector能力,以供检索与利用     remotesearcher ,以及其他可检索的实现。 (马克米勒,给予英格索兰)   3 。 Lucene的0755 :补充能够存储任意的二进制数据,在张贴的名单。     这些数据是所谓的有效载荷。为每个岗位有一个象征性的一个有效载荷的形式    一个可变长度的字节数组可以被保存在prox档案。     备注:宣传短片介绍了此功能是在实验状态,因此            载有适当的警告中的Javadoc 。      (迈克尔布希公司)   4 。 Lucene的- 834 :补充boostingtermquery这可以增加分数的基础上,     价值观的一个有效载荷(见第3段) (金英格索兰)   5 。 Lucene的- 834 :相似又有了新的方法,打分的有效载荷称为     scorepayloads可以凌驾充分利用有效载荷    存储(见# 3段)   6 。 Lucene的- 834 :补充ispayloadavailable ( )上termpositions接口和    实施它,在适当的地方(金英格索兰)   7 。 Lucene的- 853 :补充remotecachingwrapperfilter使缓存的过滤器    按遥控器上侧的RMI的连接。      (马特埃里克森途经奥的斯gospodnetic )   8 。 Lucene的- 446 :补充solr的search.function数十基于现场    价值观,加上customscorequery简单的分数(张贴)定制。      ( yonik斯利,多伦科恩)   9 。 Lucene的- 1058年:增加了新的teetokenfilter (如Unix的'三通'命令) ,并sinktokenizer可以用来分享令牌两个或两个以上    等领域,即其他领域不须经过整个分析过程中需要再次改革。举例来说,如果你有两    领域,共享所有相同的分析步骤,除了一个小写令牌和其他没有,你可以协调行动    两者之间用teetokenfilter和sinktokenizer 。见teesinktokentest.java为例子。      (赠款英格索兰,迈克尔布希公司, yonik斯利)  优化  1 。 Lucene的- 761 : proxstream现在克隆懒惰在segmenttermpositions     当nextposition ( )的要求还是第一次。这使得利用实例    对segmenttermpositions不是segmenttermdocs没有额外的费用。      (迈克尔布希公司)   2 。 Lucene的- 431 : raminputstream和ramoutputstream延长indexinput和     indexoutput直接。这样做可以避免进一步缓冲,从而避免了    不必要的阵列拷贝。 (迈克尔布希公司)   3 。 Lucene的- 730 :更新booleanscorer2要利用booleanscorer在一些    案件,并可能提高得分的表现。文件,现在都可以    发表地地道道的阶,因为他们的成绩(如hitcollector ) 。      n.b.有点代码不得不禁用queryutils为了     testboolean2测试,以保持及格。      (保罗elschot途经奥的斯gospodnetic )   4 。 Lucene的- 882 : spellchecker并不储存ngrams了,但唯一指标    他们保持阐明指数小。 (丹尼尔纳贝尔)   5 。 Lucene的- 430 :推迟分配缓冲区后,克隆bufferedindexinput 。     连同Lucene的- 888 ,这将使调整缓冲区大小    动态。 (保罗elschot ,迈克尔布希公司)    6 。 Lucene的- 888 :增加缓冲大小内compoundfilewriter和     bufferedindexoutput 。还增加缓冲区大小,在     bufferedindexinput ,但只有当使用在合并。两者合计,     这些增加产量的10-18 % ,整体表现增益随    以前的千只拖欠款项。 (迈克mccandless )   7 。 Lucene的- 866 :增加多层次跳过名单张贴名单。这将显着加快    大部分的查询使用skipto ( ) ,尤其是对大指标与大张贴    清单。平均与质疑的加速是20 %左右,为的查询功能    含有十分频繁和非常独特的条件,加速可以超过80 % 。      (迈克尔布希公司) 文件  1 。 Lucene的791 & &红外线第1173 :基础设施提出了wiki中,以     http://wiki.apache.org/lucene-java/更新了链接,在文档和    哪里,否则我发现参考资料。 (赠款英格索兰,乔Schaefer表示)   2 。 Lucene的- 807 :固定的Javadoc scoredoccomparator.compare ( ) ,将    一致java.util.comparator.compare ( ) :任何整数允许    归还而不只是-1/0/1 。      (保罗Cowan先生途经迈克尔布希公司)    3 。 Lucene的- 875 :解决的Javadoc警告&失误下jdk1.4 。     解决的Javadoc失误下jdk5 (罐在道路gdata ) 。     取得了"的Javadoc "目标依赖于"建设-c ontrib请"首下载     contrib请罐配置的动态下载。 (注:当运行    在防火墙后面,防火墙可能迅速流行起来) (多伦科恩)   4 。 Lucene的- 740 :补充雪球-l icense.txt向滚雪球一样封装并进行了    这句话对许可notice.txt 。 (潘国加士途经迈克尔布希公司)   5 。 Lucene的- 925 :补充分析软件包的Javadoc 。 (赠款英格索兰和多伦科恩)   6 。 Lucene的- 926 :补充文件包的Javadoc 。 (赠款英格索兰) 建设  1 。 Lucene的- 802 :补充license.txt和notice.txt以Lucene的罐子。      (潘国加士途经迈克尔布希公司)   2 。 Lucene的- 885 : "蚂蚁测试" ,现在包括了所有contrib请测试。新     "蚂蚁测试核心"的目标,可以用来只运行的核心(非    还有contrib )的考验。      (克里斯hostetter )       3 。 Lucene的- 900 : "蚂蚁测试" ,现在可以断言爪哇(在Lucene的包) 。      (多伦科恩)   4 。 Lucene的- 894 :添加定制建立档案,为二进制分发,其中包括    目标,以建立演示。 (克里斯hostetter ,迈克尔布希公司)   5 。 Lucene的- 904 : "一揽子"的目标,在build.xml ,现在也产生。外形尺寸:     校验和文件。 (克里斯hostetter ,迈克尔布希公司)   6 。 Lucene的- 907 :包括license.txt和notice.txt在梅塔-干扰素的dirs     演示战争中,演示罐子,以及contrib请罐。 (迈克尔布希公司)       7 。 Lucene的- 909 :演示目标运行演示。 (多伦科恩)   8 。 Lucene的- 908 :提高内容的manifest文件,使定制    对于贡献。加入雪球-l icense.txt以梅塔-干扰素的雪球    瓦罐,并保证该lucli瓦罐载license.txt和notice.txt 。      (克里斯hostetter ,迈克尔布希公司)   9 。 Lucene的- 930 :各种contrib请建设的改善,以确保contrib请    相依,都可以实现,并测试汇编误差不合格的建设。      (潘国加士,克里斯hostetter )  10 。 Lucene的622 :放入蚂蚁的目标和pom.xml档案,为建设行家文物    该Lucene的核心和contrib请单元。      (萨米祀仁,卡尔wettin ,迈克尔布希公司)  =======================释放2.1.0 2007-02-14 ================== ===== 变化在运行时的行为  1 。的' S '和' t '的已经从名单中剔除的默认停止字    在stopanalyzer (也用在由standardanalyzer ) 。拥有如的' S '     作为一个stopword意味着' S级,导致相同的结果,作为'阶级' 。     注意,这个问题仍然存在,为『 A 』 ,例如:在' A级'      ' '仍然是一个stopword 。      (丹尼尔纳贝尔)   2 。 Lucene的478 :更新名单的Unicode代码点不等,为展示CJK型快     (现分为终审法院首席法官和K )在standardanalyzer 。 (王约翰和    潘国罗经奥的斯电梯gospodnetic )   3 。修改部分展示CJK型快的Unicode代码点不等,在standardtokenizer.jj ,     增加了几颗多的人,以增加展示CJK型快字的报道。     还记载了部分的范围。      (奥的斯gospodnetic )   4 。 Lucene的- 489 :添加支持领先的通配符字符( * , ? )      queryparser 。默认是不允许他们像以前。      (潘国加士途经奥的斯gospodnetic )   5 。 Lucene的- 703 : queryparser改为默认使用的constantscorerangequery     为范围查询。补充useoldrangequery财产queryparser允许    选择旧rangequery级,如果需要。      (马克哈伍德)   6 。 Lucene的- 543 : wildcardquery现在执行termquery如果提供的任期    不包含通配符字符( ?或* ) ,当以前     stringindexoutofboundsexception被抛出。      (迈克尔布希公司经埃里克出雏机)   7 。 Lucene的- 726 :除去利用废弃doc.fields ( )方法和    枚举。      (迈克尔布希公司经奥的斯电梯gospodnetic )   8 。 Lucene的- 436 :除去敲定( ) terminfosreader和segmentreader ,     并新增一个电话enumerators.remove ( ) terminfosreader.close ( ) 。     该敲定( )压倒加入,以帮助前1.4.2 JVM的错误    这已被固定,再加上我们不再支持预1.4.2 jvms 。      (奥的斯gospodnetic )   9 。 Lucene的- 771 :默认位置的写锁现    索引目录,并命名为简单的" write.lock " (无大    消化前缀) 。系统属性" org.apache.lucene.lockdir "     也不是" java.io.tmpdir "早已不再是用来作为全球目录    存放锁定档案,并lock_dir领域fsdirectory是    现在已经过时了。 (迈克mccandless ) 新功能  1 。 Lucene的- 503 :新thaianalyzer和thaiwordfilter在contrib请/分析仪     ( samphan raruenrom途经克里斯hostetter )   2 。 Lucene的- 545 :新fieldselector API及相关变更     indexreader和实现。新fieldable接口,用于    与懒惰场装载机制。 (赠款英格索兰和Chuck     威廉斯途经金英格索兰)   3 。 Lucene的- 676 :移至solr的prefixfilter以Lucene的核心。 (由良    斯莫尔斯基, yonik斯利)   4 。 Lucene的- 678 :补充nativefslockfactory ,实行锁    使用OS本地锁(经java.nio .* ) 。 (迈克尔mccandless经     yonik斯利)   5 。 Lucene的- 544 :补充能力,指定不同的提升,能因应    不同的领域时,用multifieldqueryparser (马特埃里克森    途经奥的斯gospodnetic )   6 。 Lucene的- 528 :新indexwriter.addindexesnooptimize ( ) ,这并不    优化指数何时加入新的细分,只有表演    合并或按需要发放。 (李宁途经yonik斯利)   7 。 Lucene的- 573 : queryparser现在允许反斜线逃逸    引用的名词术语。 (迈克尔布希公司经yonik斯利)   8 。 Lucene的- 716 : queryparser现在允许规格的Unicode     人物条款通过的Unicode逃生的形式/ uxxxx      (迈克尔布希公司经yonik斯利)   9 。 Lucene的- 709 :补充ramdirectory.sizeinbytes ( ) , indexwriter.ramsizeinbytes ( )     和indexwriter.flushramsegments ( ) ,可以使应用    控制的记忆体数量用来缓冲文件。      (夹头威廉姆斯途经yonik斯利)  10 。 Lucene的- 723 : queryparser现在解析: * * matchalldocsquery      ( yonik斯利)  11 。 Lucene的- 741 :命令行实用程序修改或删除规范    对各个领域,在现有的指数。这主要是基于Lucene的- 496     住在contrib请/杂项。      (克里斯hostetter ,奥的斯gospodnetic )  12 。 Lucene的- 759 :补充ngramtokenizer和edgengramtokenizer阶级和    他们通过单元测试。      (奥的斯gospodnetic )  13 。 Lucene的- 565 :补充方法indexwriter能够更高效    处理更新文件( "删除,然后加上"用例) 。这    是打算以最终取代现行     indexmodifier 。补充indexwriter.flush ( ) (改名为从     flushramsegments ( ) ) ,以冲洗所有悬而未决的更新(在内存) ,以    该名录。 (李宁透过麦克mccandless )  14 。 Lucene的- 762 :补充说,在规模和size_and_break fieldselectorresult选项    它允许一个检索的大小就像一场未经检索    实际领域。 (夹头威廉姆斯途经金英格索兰)  15 。 Lucene的- 799 :妥善处理懒惰,压缩领域的合作。      (迈克klaas途经金英格索兰) 空气污染指数的变化  1 。 Lucene的- 438 :消除"最后的"从道理,落实cloneable ,请允许    变化termtext途经settermtext ( ) 。 ( yonik斯利)   2 。 org.apache.lucene.analysis.nl.wordlistloader已被废弃    和原本应该是取代与wordlistloader班    包org.apache.lucene.analysis (丹尼尔纳贝尔)   3 。 Lucene的- 609 :回复返回型的document.getfield (们) ,场    为向后兼容,增加了新的document.getfieldable ( )     为获得新的懒加载领域的合作。 ( yonik斯利)   4 。 Lucene的- 608 : document.fields ( )已被废弃和新方法     document.getfields ( )已补充说,返回一个名单,而不是    枚举(丹尼尔纳贝尔)   5 。 Lucene的- 605 :新explanation.ismatch ( )方法和新complexexplanation     子类允许解释方法产生的解释模式     "匹配"独立的具有正面价值。      (克里斯hostetter )   6 。 Lucene的- 621 :新的静态方法indexwriter.setdefaultwritelocktimeout     和indexwriter.setdefaultcommitlocktimeout为压倒一切默认    超时值,为将来所有的事例indexwriter (以及    至于任何其他阶级的,可参考的静态价值,     即: indexreader ) 。      (迈克尔mccandless途经克里斯hostetter )   7 。 Lucene的- 638 : fsdirectory.list ( ) ,现在只返回该目录的     Lucene的相关文件。由于这一改变现在可以建构     1 ramdirectory从一个文件系统目录中包含文件    不涉及Lucene的。      (西蒙willnauer途经丹尼尔纳贝尔)   8 。 Lucene的- 635 :解耦锁定的实施时间由目录    执行。补充设置/ getlockfactory至目录,并提出    所有锁码到子类抽象类lockfactory 。      fsdirectory和ramdirectory仍拖欠他们事先锁定    实现的,但现在你可以自由地混合与匹配,例如使用     singleinstancelockfactory (即,在内存锁定)锁定同一个     fsdirectory 。注意,现在你必须呼吁setdisablelocks前    该实例1 fsdirectory如果你想禁用锁    对于该目录中。      (迈克尔mccandless ,杰夫帕特森途经yonik斯利)   9 。 Lucene的- 657 :取得fuzzyquery非最终与内scoreterm保障。      (潘国加士途经奥的斯gospodnetic )  10 。 Lucene的- 701 : lockless承诺:承诺锁已不再需要    当一个作家的命令,和一个读者打开了指数。这包括    改变指数文件格式(见文档/ fileformats.html为    详情) 。它也消除了所有API与承诺    锁及超时。读者现在真正唯读,不    第一座另一个启动。这是第一步,以获得     Lucene的工作,正确超过NFS的(第二个步骤是     Lucene的- 710 ) 。 (迈克mccandless )  11 。 Lucene的- 722 : default_min_doc_freq被拼错defalt_min_doc_freq     在相似的morelikethis阶层。该拼错已    取而代之的正确拼写。      (安迪vajda途经丹尼尔纳贝尔)  12 。 Lucene的- 738 :缩小档案记录,其中    文件被删除时,有多少删除的文件    小。这改变了索引文件格式,并不能    阅读先前版本的Lucene的。 (多伦科恩途经yonik斯利)  13 。 Lucene的- 756 :维持所有准则,在一个单一的。自然资源管理档案,以减少    许多公开的档案和文件内容概述非复合指数    格式。这改变了索引文件格式,但能够保持    阅读能力和更新旧的指标。第一部分合并    对旧格式指数将建立一个单一的。自然资源管理档案,为新    部分。 (多伦科恩途经yonik斯利)  14 。 Lucene的- 732 : datetools支持已经被加入到queryparser ,     二传手都默认决议,并每场决议案。     为了向下兼容, datefield是仍在使用,如果没有决议    指明。 (迈克尔布希公司经克里斯hostetter )  15 。补充isoptimized ( )方法来indexreader 。      (奥的斯gospodnetic )  16 。 Lucene的- 773 : deprecate了fsdirectory.getdirectory ( * )的方法    采取一个布尔"创造"的说法。反之,你应该使用     indexwriter的"创造"的论调,以创建一个新的指数。      (迈克mccandless )  17 。 Lucene的- 780 :添加一个静态directory.copy ( )方法来复制文件    从一个目录到另一个地方。 (依库恩透过麦克mccandless )  18 。 Lucene的- 773 :补充directory.clearlock (串名称) ,有力地    拆除旧锁。默认的执行是要求     lockfactory (如果非空) ,以明确的锁定。 (迈克mccandless )  19 。 Lucene的- 795 : directory.renamefile ( )已被废弃,因为它是    不要再使用内Lucene的。 (丹尼尔纳贝尔)  bug修复  1 。固定网络应用演示(内置与"蚂蚁战争演示" )     没有工作,因为它用了一个queryparser方法了    被拆除(丹尼尔纳贝尔)   2 。 Lucene的- 583 : isolatin1accentfilter未能保存positionincrement      ( yonik斯利)   3 。 Lucene的575 : spellchecker敏分数,是不正确的改变,由suggestsimilar      (卡尔wettin途经yonik斯利)   4 。 Lucene的- 587 : explanation.tohtml产生畸形的HTML      (克里斯hostetter )   5 。修理,让matchalldocsquery可以使用remotesearcher ( yonik斯利)   6 。 Lucene的- 601 : ramdirectory和ramfile作出串行化     (卡尔wettin途经奥的斯gospodnetic )   7 。 Lucene的- 557 :修补,以booleanquery和filteredquery使该评分    解释匹配了与实际分数。      (克里斯hostetter )   8 。 Lucene的- 607 : parallelreader的termenum未能预先妥善    新的领域(夹头威廉姆斯,基督教kohlschuetter途经yonik斯利)   9 。 Lucene的- 610 , Lucene的- 611 :简单的语法变化,使编制与欧洲法院:      disambiguate党内一流射手的使用DOC的( )在booleanscorer2 ,     其他测试代码的变化。 (马克史密斯途经yonik斯利)  10 。 Lucene的- 451 :所有核心的查询类型,现在使用complexexplanations使    新增的零不要混淆booleanweight解释方法。      (克里斯hostetter )  11 。 Lucene的- 593 :固定lucenedictionary的党内迭代     ( kåre fiedler克里斯坦森途经奥的斯gospodnetic )  12 。 Lucene的- 641 :固定场外由一臭虫与indexwriter.setmaxfieldlength ( )      (丹尼尔纳贝尔)  13 。 Lucene的- 659 :珍爱perfieldanalyzerwrapper代表getpositionincrementgap ( )     要正确分析仪,用于现场。 (夹头威廉姆斯途经yonik斯利)  14 。 Lucene的- 650 :固定的NPE在当地的具体字符串排序时,文件    没有价值。      (奥利弗记途经克里斯hostetter )  15 。 Lucene的- 683 :固定数据贪污阅读时偷懒装领域。      ( yonik斯利)  16 。 Lucene的- 678 :固定的臭虫在nativefslockfactory造成相同    锁,以分担不同的目录中。      (迈克尔mccandless途经yonik斯利)  17 。 Lucene的- 690 :固定螺纹不安全使用indexinput由懒惰装领域。      ( yonik斯利)  18 。 Lucene的- 696 :定位错误时,得分手为disjunctionmaxquery已skipto ( )     要求它明年之前( ) 。 ( yonik斯利)  19 。 Lucene的- 569 :固定spannearquery臭虫,为' inorder疑问,它会败诉    承认下令跨度,如果他们重叠无序跨度。      (保罗elschot途经克里斯hostetter )  20 。 Lucene的- 706 :更新fileformats.xml |的HTML有关docdelta价值    在频文件。 (约翰stuyts ,多伦科恩途经金英格索兰)  21 。 Lucene的- 715 :固定私营构造indexwriter.java至    妥善释放后天写锁,如果存在一个     ioexception后获得写锁,但在此之前整理    实例化。 (马太博戈西安途经麦克mccandless )  22 。 Lucene的- 651 :多线程的不同要求,同时     fieldcache入境(通常为整理,一个外地)在同    时间造成多代指入境,这是    不利的性能和内存使用。      (奥利弗记途经奥的斯gospodnetic )  23 。 Lucene的- 717 :固定build.xml不是要失败的时候,有没有库迪尔。      (多伦科恩途经奥的斯gospodnetic )  24 。 Lucene的- 728 :除去重复/旧morelikethis和similarityqueries     上课时间还有contrib /相似性,因为他们的新家园,是根据    还有contrib /疑问。      (奥的斯gospodnetic )  25 。 Lucene的- 669 :不要双关在randomaccessfile      fsindexinput /输出期间敲定( ) 。除了派     ioexception了向总理事会,这也可能是导致这种间歇     "处理的是无效的" ioexceptions Windows的时候,试图    接近读者或作家。 (迈克尔布希公司透过麦克mccandless )  26 。 Lucene的- 702 :定位indexwriter.addindexes ( * ) ,不贪指数    对任何例外(如磁盘全额) 。语义,这些方法    现在交易性质:要么,各项指标均合并或无。     此外,固定indexwriter.mergesegments (称为外     addindexes ( * ) adddocument ,优化, flushramsegments )      indexreader.commit ( ) (称为亲密) ,以清理和保持    比如国家一致的,以什么的,其实在指数(迈克     mccandless ) 。  27 。 Lucene的- 129 :改变定稿做"尝试{...}最后     ( super.finalize ();}" ,以确保我们千万不要错过,在定稿    班以上。 ( esmond彼特透过麦克mccandless )  28 。 Lucene的- 754 :定位问题,介绍了Lucene的- 651 ,造成     indexreaders以流连永远的,除了不    操纵原fieldcache性能问题。      (克里斯hostetter , yonik斯利)  29 。 Lucene的- 140 :定indexreader.deletedocument ( int起点docnum )     正确提高arrayindexoutofboundsexception当docnum太    大。以前,如果docnum只稍微过大(     同样多的八,即高达7 ints超越maxdoc ) ,没有    例外会提高,相反,该指数将成为    静静地败坏了。腐败,那么结果只会出现晚得多,     在mergesegments ,当腐化部分,是并入    部分( )之后。 (迈克mccandless )  30 。 Lucene的- 768 :修复的情况下,破例在deletedocument ,      undeleteall或setnorm在indexreader可以离开读者在    状态接近( )不释放写锁。      (迈克mccandless )  31 。罢免"入境许可证" ,从已知的索引文件的扩展,因为它是    从来没有使用过。 (尼可拉斯lalevée途经贝瀚梅塞尔)      32 。 Lucene的- 767 :如何改变segmentreader.maxdoc ( )的计算方法是不    依靠文件长度检查,而是使用segmentinfo的     doccount ,这种情况已经明确地存放在索引中。这是一个    防守漏洞修复(即,不存在已知的问题,可见"实质    人生" ,由于这只是一个可能的未来问题) 。 (夹头    威廉姆斯透过麦克mccandless ) 优化   1 。 Lucene的- 586 : termdocs.skipto ( ) ,现在更有效率     多段指标。此举将改善业绩的许多     各类疑问,对一个非优化指标。 (黄宏发哈德森     经yonik斯利)    2 。 Lucene的- 623 : ramdirectory.close现在nulls其参考,以各     内部的"档案" ,让他们可获gced即使提到了      ramdirectory本身仍然存在。 ( nadav har'el途经克里斯hostetter )    3 。 Lucene的- 629 :压缩领域不再是无压缩和      recompressed期间部分合并(例如,在索引或     优化) ,从而提高性能。 (迈克尔布希公司途经奥的斯      gospodnetic )    4 。 Lucene的- 388 :提高索引性能时,是maxbuffereddocs      大型经常保持计数的缓冲文件,而不是     计数后,每一份文件,除了。 (多伦科恩,保罗史密斯      yonik斯利)    5 。改性termscorer.explain使用termdocs.skipto ( ) ,而不是     缝盘通过文档。 (赠款英格索兰)    6 。 Lucene的- 672 :新的索引部分合并政策冲所有     缓冲文件,以他们自己的部分和拖延合并,直到      mergefactor环节一定水平得到积累。      这都增加了索引的表现在场删除     文档或部分满阶层以及使未来     优化。      注:本也修正了一个"根据合并"的错误,它是     可能得到的太多环节在你的指数(这将     大幅放缓搜索,风险用尽文件描述符     限制等) 。这是可以发生的时候,有多少缓冲的文档     接近,再加上若干文档,在过去的非内存部分,是     大于mergefactor 。 (李宁, yonik斯利)    7 。懒惰装领域不必要保留一个额外的副本装     字符串数据。 ( yonik斯利)    8 。 Lucene的- 443 : conjunctionscorer的性能提升。加快     任何booleanquery一个以上的强制性条款。       (阿卜杜勒乔德里,保罗elschot途经yonik斯利)    9 。 Lucene的- 365 : disjunctionsumscorer业绩增长      〜 30 % 。加快疑问与任择条款。 (保罗elschot经      yonik斯利)   10 。 Lucene的- 695 :优化bufferedindexinput.readbytes ( ) ,中型     大小缓冲器,这将加快合并和检索二进制     和压缩领域的合作。 ( nadav har'el途经yonik斯利)   11 。 Lucene的- 687 :懒惰的跳跃就接近档案速度最     疑问涉及任期的职位,包括短语查询。       (迈克尔布希公司经yonik斯利)   12 。 Lucene的- 714 :更换2案件手册闭环阵列复制     与通话system.arraycopy相反,在documentwriter.java 。       (尼可拉斯lalevee透过麦克mccandless )   13 。 Lucene的- 729 :非递归skipto和明年实施      termdocs为multireader 。旧的,可以执行      recurse最多有多少环节在指数。 ( yonik斯利)   14 。 Lucene的- 739 :提高部分合并表演重用     规范阵列横跨不同领域做散装写道:      规范的环节,没有删除文档。      (迈克尔布希公司经yonik斯利)   15 。 Lucene的- 745 :添加booleanquery.clauses ( ) ,允许直接进入     该份名单中的条款,并取代内部同步向量     同一个同步的名单。 ( yonik斯利)   16 。 Lucene的- 750 :移除定稿,由fsindexoutput及动议      fsindexinput finalizer以实际文件,使所有的无性系不     注册新的finalizer 。 ( yonik斯利) 测试案例   1 。补充testtermscorer.java (金英格索兰)    2 。补充testwindowsmmap.java (班森margulies透过麦克mccandless )    3 。 Lucene的- 744个附列user.name财产上临时目录     这就是创造,因此不会干扰其他用户。 (赠款英格索兰) 文件   1 。补充样式表,以xdocs命名lucene.css并包括在      anakia vsl描述。 (赠款英格索兰)    2 。补充scoring.xml文件到xdocs 。更新similarity.java      得分公式(赠款英格索兰和史蒂夫罗维。更新:      迈克尔mccandless ,多伦科恩,克里斯hostetter ,道格切割) 。      问题664 。    3 。补充的Javadoc fieldselectorresult.java 。 (赠款英格索兰)    4 。提出xdocs目录,以钢骨混凝土/网站/ src目录/文件/内容/ xdocs %      问题707个。网站现在还建立了用福里斯特,就像其他Lucene的     兄弟姐妹。见http://wiki.apache.org/jakarta-lucene/howtoupdatethewebsite      上的信息更新网站。 (英格索兰给予的帮助下,由史蒂夫罗维,      克里斯hostetter ,道格切割,奥的斯gospodnetic , yonik斯利)    5 。补充说,在开发商和系统要求路段下的资源(金英格索兰)    6 。 Lucene的- 713更新任期向量组的档案格式,包括     文件就如何抵消和位置信息储存在tvf档案。       (赠款英格索兰,萨米尔abdou )    7 。补充,在连接到三叶草测试代码覆盖报告下发展     科资源(金英格索兰)    8 。 Lucene的- 748 :补充细节语义indexwriter.close对     打一个例外。 (微型轿车市场史维理途经麦克mccandless )    9 。补充了一些文本什么是载于新闻稿。       (李家祥haszlakiewicz途经金英格索兰)    10 。 Lucene的- 758 :定位与JavaDoc澄清ramdirectory (目录)       使得完整版的起始目录。 (迈克mccandless )    11 。 Lucene的- 764 :定位的Javadoc细节临时空间需求      为indexwriter的优化( ) , addindexes ( * )和adddocument (...)       方法。 (迈克mccandless ) 建设   1 。补充说,在三叶草测试代码覆盖率百分之http://issues.apache.org/jira/browse/lucene-721      使三叶草代码覆盖,你一定有clover.jar在蚂蚁      classpath下,并指定- drun.clover =真正的命令行。       (迈克尔布希公司,并给予英格索兰)    2 。增加了一个sysproperty在共同build.xml每Lucene的752至地图java.io.tmpdir至      $ ( build.dir ) /测试就像tempdir sysproperty 。    3 。 Lucene的- 757增添了新的目标命名的init -的dist但这格局     分布既二进制和源分布情况。所谓包装     与包装- *-钢骨混凝土 =======================释放2.0.0 2006年5月26日================== ===== 空气污染指数的变化  1 。所有已废弃的方法和领域,已被调离,除了     datefield ,它仍然会得到支持,为一些时间    所以Lucene的,可以阅读其领域日期从旧指标     ( yonik斯利&金英格索兰)   2 。 disjunctionsumscorer不再是公众。      (保罗elschot途经奥的斯gospodnetic )   3 。创造一个领域都与一个空洞的名称和空值    现在抛出一个illegalargumentexception      (丹尼尔纳贝尔)   4 。 Lucene的- 301 :增加了新的indexwriter ( (字符串,文件,目录)     分析器)施工人员表示,不采取一个布尔"创造"     论据。这些新的施工人员将创建一个新的指数,如果    必要的,否则,附加到现有的功能组别。 (丹armbrust经    麦克mccandless ) 新功能  1 。 Lucene的- 496 :命令行工具,需要修改的规范场的一个    现有的指数;补充说:还有contrib /杂项。 (克里斯hostetter )   2 。 Lucene的- 577 : sweetspotsimilarity补充说:还有contrib /杂项。      (克里斯hostetter )      bug修复  1 。 Lucene的330 :解决问题的filteredquery没有工作,妥善以内     booleanquery 。 (保罗elschot途经埃里克出雏机)   2 。 Lucene的- 515 :使constantscorerangequery和constantscorequery工作    与remotesearchable 。 (菲利普laflamme途经yonik斯利)   3 。补充方法,以取得/设置writelocktimeout和commitlocktimeout在     indexwriter 。这些可定在Lucene的1.4使用系统财产。     此功能已被拆掉,没有加入相应    吸气/ setter方法。 (丹尼尔纳贝尔)   4 。 Lucene的- 413 :固定arrayindexoutofboundsexception例外    当使用spanqueries 。 (保罗elschot途经yonik斯利)   5 。实施filterindexreader.getversion ( )和iscurrent ( )      ( yonik斯利)   6 。 Lucene的- 540 :固定一个bug与indexwriter.addindexes (目录[ ] )     这有时会导致指数秩序的文件,以改变。      ( yonik斯利)   7 。 Lucene的- 526 :固定的一个bug fieldsortedhitqueue造成    随后弦乐各种不同的locales排序相同。      (保罗Cowan先生途经yonik斯利)   8 。 Lucene的- 541 :添加失踪extractterms ( ) disjunctionmaxquery      (斯特凡将途经yonik斯利)   9 。 Lucene的- 514 :补充gettermarrays ( )和extractterms ( )      multiphrasequery (李家祥贾殷& yonik斯利)  10 。 Lucene的- 512 :固定classcastexception在parallelreader.gettermfreqvectors      (福雷德克途经yonik )  11 。 Lucene的- 352 :固定的臭虫在spannotquery这表现为:      nullpointerexception时, "排除"的质疑并非spantermquery 。      (克里斯hostetter )  12 。 Lucene的- 572 :固定的臭虫在spannotquery hashcode ,无视排除条款     (克里斯hostetter )  13 。 Lucene的- 561 :固定部分parallelreader臭虫。 nullpointerexception如果读者    不知道外地的,但读者并不了解,如果有缺失,     和deletedocument通话可以绕过同步对subreaders 。      (夹头威廉姆斯途经yonik斯利)  14 。 Lucene的- 556 :补充空extractterms ( )执行,以matchalldocsquery和     constantscorequery为了让他们使用,以multisearcher 。      ( yonik斯利)  15 。 Lucene的- 546 :除去2 GB的文件大小限制为ramdirectory 。      (彼得皇家, Michael Chan说, yonik斯利)  16 。 Lucene的- 485 :不承诺锁,同时去过时指数    档案。 (吕克vanlerberghe经切割)  1.9.1  bug修复  1 。 Lucene的- 511 :修复一个bug在bufferedindexoutput优化    介绍在190决赛。 ( shay banon &潘国tamm经切割)  1.9决赛注意,这个版本是多数,但不是百分之一百源兼容先前发布的Lucene的( 1.4.3 ) 。在其他的话,你应该确保你的应用程序编制与此版本的Lucene的前你取代旧Lucene的罐子与新的。有许多方法都被废弃了预期的2.0版,所以控诉警告是意料之中的时候,记者杨彪报道:从1.4.3至1.9 。  bug修复   1 。修复了indexwriter.setmaxbuffereddocs ( 1 )工作,有负    影响索引的性能,并因此得到回复。该    论据setmaxbuffereddocs ( int )的,现在必须至少为2 ,否则    一个例外是抛出。 (丹尼尔纳贝尔)  优化       1 。优化bufferedindexoutput.writebytes ( )的使用     system.arraycopy ( ) ,在更多情况下,而不是照搬字节按字节。      (卢卡斯zapletal经切割)  1.9 rc1 要求  1 。以编制和使用Lucene的,你现在需要的Java 1.4或更新版本。 变化在运行时的行为  1 。 fuzzyquery再也不能扔toomanyclauses例外。如果一个     fuzzyquery扩大至超过booleanquery.maxclausecount     条件只有booleanquery.maxclausecount最相似条款    进入改写了质疑,因此,例外的情况是可以避免的。      (克里斯多夫)   2 。改变系统特性,由" org.apache.lucene.lockdir "      " org.apache.lucene.lockdir " ,所以它的外壳沿用现行    模式用在其他Lucene的系统属性。 (贝瀚)   3 。条款rangequeries和fuzzyqueries现正转化为    小写默认(因为它已经如此prefixqueries     和wildcardqueries前) 。使用setlowercaseexpandedterms (假)     要禁用此行为,但注意,这也影响     prefixqueries和wildcardqueries 。 (丹尼尔纳贝尔)   4 。文件的次数太多,计算时multisearcher是用现    计算机正确, "在全球范围内"一刀切subsearchers和指数,而    之前,它曾经是计算机在本地各个指标,从而导致    排名跨多个指标不具有相同含义。      (夹头威廉姆斯,狼西伯斯基途经奥的斯,臭虫编号31841 )   5 。开业时,一个indexwriter与创造=属实, Lucene的,现在只是删除    它自己的档案,从索引目录(看文件名的后缀    决定,如果一个文件属于Lucene的) 。在旧的行为被删除    所有的档案。 (丹尼尔纳贝尔和贝瀚梅塞尔,错误编号34695 )   6 。该版本的indexreader ,经由getcurrentversion ( )     和getversion ( )并不开始于0了新的指标。相反,它    现在初始化,由系统时间在几毫秒。      (贝瀚梅塞尔途经丹尼尔纳贝尔)   7 。几个缺省值,可以不设通过系统性能看不下去,因为    有考虑过这个问题不宜在一个图书馆一样, Lucene的。为    大多数性能有设置/获取方法可在indexwriter其中    你应该使用。这将影响以下属性:     见indexwriter为吸气/ setter方法:        org.apache.lucene.writelocktimeout , org.apache.lucene.commitlocktimeout ,        org.apache.lucene.minmergedocs , org.apache.lucene.maxmergedocs ,        org.apache.lucene.maxfieldlength , org.apache.lucene.termindexinterval ,        org.apache.lucene.mergefactor ,     见booleanquery为吸气/ setter方法:        org.apache.lucene.maxclausecount     见fsdirectory为吸气/ setter方法:        disablelucenelocks      (丹尼尔纳贝尔)   8 。固定fieldcacheimpl使用用户提供intparser和floatparser ,     与其用整数及浮动班解析。      ( yonik斯利途经奥的斯gospodnetic )   9 。专家级搜索例程返回topdocs和topfielddocs     不再正常化分数。这也修复了臭虫相关     multisearchers和分数排序/正常化。      (吕克vanlerberghe途经yonik斯利, Lucene的- 469 ) 新功能  1 。增加的支持对于存储压缩领域(补丁编号31149 )      (贝瀚梅塞尔途经克里斯多夫)   2 。增加的支持对于二进制存储领域(补丁编号29370 )      (提请哈桑和贝瀚梅塞尔途经克里斯多夫)   3 。补充支持的立场,并抵消了信息在任期载体     (补丁编号18927 ) 。 (赠款英格索兰&克里斯多夫)   4 。一类新datetools已经被加入。它可以让你的日期格式    在一个可读的格式已经足够索引。不像现行     datefield级datetools能应付日期1970年之前,它    逼着你指明所期望的日期的决议(如一个月,一天,     第二, … … ) ,它可以使rangequerys对这些领域更有效率。      (丹尼尔纳贝尔)   5 。 queryparser现在正确工程与分析仪,可以返回更多    超过一个令牌每立场。例如,查询" +快速+汽车"     将被解析为" +快速+ (车汽车) , "如果分析器    回报"汽车"和"汽车"上的立场是一致的时候    认定的"汽车" (补丁编号23307 ) 。      ( pierrick brihaye ,丹尼尔纳贝尔)   6 。证无缓冲目录中的实现(例如,使用mmap ) 。      inputstream是代之以新班indexinput和     bufferedindexinput 。 outputstream是代之以新班     indexoutput和bufferedindexoutput 。 inputstream和outputstream     现在已废弃,并fsdirectory现在subclassable 。 (切割)   7 。加上本土目录和termdocs建置工作    升阳。这些都需要海合会3.4.0或更新版本,只有经过测试    在Linux上。使用'蚂蚁升阳'建立演示应用。 (切割)   8 。放入mmapdirectory ,它使用氧化镍,以mmap输入档案。这是    还是有点慢fsdirectory 。不过,它使用较少    记忆每一个查询搜索,因为一个新的缓冲区,是不是分到每个    而言,可以帮助申请使用,如通配符    疑问。它也可能终有一天将更快。 (切割&保罗elschot )   9 。补充的Javadoc -内部build.xml -臭虫编号3 0360      (保罗elschot途经奥的斯)  10 。补充rangefilter ,更笼统地有用过滤比datefilter 。      (克里斯米hostetter途经埃里克)  11 。补充numbertools ,工具类索引数字领域的合作。      (改编自典贡献马特鹌鹑;致力于由Erik )  12 。补充公共静态indexreader.main (串[ ]距翻译起始位)的方法。      indexreader现在可以用来直接在命令行水平    以名单,并有选择地提取个人档案,由现行    复合索引文件。      (改编自典贡献盖瑞特鲁尼;犯下的贝瀚)  13 。放入indexwriter.settermindexinterval ( )方法。见的Javadoc 。      (道格切割)  14 。补充lucenepackage ,其静态get ( )方法返回java.util.package ,     让来电者获得Lucene的版本信息,在指定    该Lucene的罐子。      (道格切割途经奥的斯)  15 。补充hits.iterator ( )方法和相应的hititerator击中物体。     这项规定标准java.util.iterator迭代以上命中目标。     每次通话向迭代器的下一个( )方法返回一个打击对象。      (杰里rayner途经埃里克)  16 。放入parallelreader , indexreader相结合的独立指标    以上不同领域成单一虚拟指数。 (道格切割)  17 。放入intparser和floatparser界面,以fieldcache ,使    场任意格式,可存储作为ints和彩车。      (道格切割)  18 。补充级org.apache.lucene.index.indexmodifier相结合     indexwriter和indexreader ,使您可以添加和删除文件,而不    担心同步/锁定事宜。      (丹尼尔纳贝尔)  19 。 Lucene的,现在可以用内未签名Applet的,因为Lucene的的访问    以系统性能不会令securityexception了。      (琼舒斯特途经丹尼尔纳贝尔,错误编号34359 )  20 。增加了一个新的阶层matchalldocsquery相匹配的所有文件。      (王约翰途经丹尼尔纳贝尔,错误编号34946 )  21 。补充能力,以省去规范,对每场的基础上,以减少    指数的大小和内存消耗的时候,是有很多方面的索引。     见field.setomitnorms ( )      ( yonik斯利, Lucene的- 448 )  22 。补充nullfragmenter还有contrib / highlighter ,这是有益的    突出整个文件或领域的合作。      (埃里克出雏机)  23 。补充正规表示疑问, regexquery和spanregexquery 。     注同一任期枚举变量适用于这些质疑    适用于wildcardquery和其他任期扩大疑问。     这两个新的疑问,目前不支持通过queryparser 。      (埃里克出雏机)  24 。补充constantscorequery其中包过滤器,并产生一个分数    等于质疑刺激每个匹配的文件。      ( yonik斯利, Lucene的- 383 )  25 。补充constantscorerangequery生产不断分数为    每一份文件,在该范围内。有一个好处,超过正常rangequery     的是,它没有扩大到booleanquery ,因而并没有一个最高    若干条款的范围可以涵盖。这两个端点也可予以公开。      ( yonik斯利, Lucene的- 383 )  26 。补充,还能够指定最少数目的任择条款    必须匹配在booleanquery 。见booleanquery.setminimumnumbershouldmatch ( ) 。      (保罗elschot ,克里斯hostetter途经yonik斯利, Lucene的- 395 )  27 。补充disjunctionmaxquery规定的最高分数了自己的条款。     这是非常有益的探索跨越多个领域的合作。      (夹头威廉姆斯途经yonik斯利, Lucene的- 323 )  28 。新一类isolatin1accentfilter取代口音汉字在ISO     拉丁语一字符集,由他们unaccented当量。      (斯文duzont途经埃里克出雏机)  29 。新一类keywordanalyzer 。 " tokenizes "整个流作为一个单一的道理。     这是非常有用的数据一样,邮递区号, ID和一些新产品的名字。      (埃里克出雏机)  30 。复制lengthfilter从contrib请区核心。删除的话太    长太短,从流。      (大卫斯宾塞途经奥的斯和丹尼尔)  31 。补充getpositionincrementgap (字符串字段) ,以分析仪。这使得    定制分析仪把差距场实例与同一领域    姓名,以防止短语或跨度疑问跨越这些界限。该    默认实施问题的一项空白, 0 ,让默认令牌    位置增量1至把下一个字段的第一令牌成    接二连三的立场。      (埃里克出雏,意见yonik )  32 。 stopfilter现在可以忽略的情况时,检查站的话。      (赠款英格索兰途经yonik , Lucene的- 248 )  33 。放入topdoccollector和topfielddoccollector 。这些简化    实施击中收藏家收集只    得分最高的或自上而下的排序命中目标。 空气污染指数的变化  1 。几个方法和领域已被废弃了。 API文档    包含有关建议的替代产品。这是计划    因为大部分的废弃方法和新领域,将被遣送离境     Lucene的2.0 。 (丹尼尔纳贝尔)   2 。俄罗斯和德国仪已经被转移到contrib请/分析器。     此外, wordlistloader阶级已被移动一个层次,在    等级制度,并正org.apache.lucene.analysis.wordlistloader      (丹尼尔纳贝尔)   3 。空气污染指数包含的方法,声称要抛出一个ioexception     但从未尝试过。这些声明被拆除。如果    你的代码试图赶上这些例外情况,你可能需要移除    那些赶上条文,以避免编译错误。 (丹尼尔纳贝尔)   4 。添加Serializable的参数级规范参数的ENUM     班booleanclause和外地。 (克里斯多夫)   5 。补充重写方法,以所有spanquery子筑巢其他spanquerys 。     这使得定制spanquery亚表示,重写(任期扩张,为    举例来说) ,巢内的内置式spanquery班成功。  bug修复  1 。 JSP的演示页面(钢骨混凝土/ JSP中/ results.jsp ) ,现在适当关闭     indexsearcher它揭开了。 (丹尼尔纳贝尔)   2 。固定的一个bug indexwriter.addindexes ( indexreader [ ]读者)     阻止删除一些过时的部分。 (克里斯多夫goller )   3 。 FIX在fieldinfos以避免返回额外的空白领域     indexreader.getfieldnames ( ) (补丁编号19058 ) 。 (马克哈伍德途经贝瀚)   4 。一些组合booleanquery和multiphrasequery (原     phraseprefixquery )可能挑起unsupportedoperationexception      (错误编号33161 ) 。 ( rhett sutphin途经丹尼尔纳贝尔)   5 。小bug skipto的conjunctionscorer造成nullpointerexception     如果skipto ( )被称为没有事先致电到明年( )固定的。 (克里斯多夫)   6 。禁用similiarty.coord ( ) ,在得分的大部分自动    布尔产生疑问。该coord ( )评分的因素是    适当的时候,条文是独立指定一个用户,     但通常是不恰当的时候,第产生    自动,例如,由一个模糊,通配符或远程查询。火柴    这种自动产生疑问不再受罚    不匹配的所有条款。 (道格切割,补丁编号33472 )   7 。获得锁定文件与lock.obtain (长期) ,本来是要等待    某一金额毫秒,而这却是行不通的。      (王约翰途经丹尼尔纳贝尔,错误编号33799 )   8 。修理fsdirectory.createoutput ( ) ,始终创造新的档案。     以前,现有的档案被覆写,以及一个指数可    败坏的时候,旧版本的一个文件,时间较新。     现在,任何现有的档案是第一次拆除。 (道格切割)   9 。修理booleanquery含有嵌套spantermquery的,而此前    可以返回一个不正确点击次数。      ( reece威尔顿途经埃里克出雏,错误编号35157 )  10 。修理nullpointerexception可能发生的一个multiphrasequery     内booleanquery 。      (汉斯耶尔姆和斯科蒂李鹏飞途经丹尼尔纳贝尔,错误编号35626 )  11 。固定snowballfilter可以穿越位置由增量    原来道理。      ( yonik经斯利埃里克出雏, Lucene的- 437 )  12 。补充Unicode的各种韩文字体,以standardtokenizer ,     分组毗连字符成为一个象征,而不是只有一个道理    每字。这种变化也改变了心意型向" <cj> "     对于中文和日文字符令牌(以前这是" <cjk> " ) 。      ( cheolgoo康途经奥的斯和埃里克, Lucene的- 444和Lucene的- 461 )  13 。 fieldsreader现在看来,在fieldinfo.storeoffsetwithtermvector和     fieldinfo.storepositionwithtermvector ,并创造了场    正确termvector参数。      (弗兰克斯氏经伯恩哈德Lucene的- 455 )  14 。固定wildcardquery要防止"猫"配对"的核证机关? ? " 。      (消马经伯恩哈德Lucene的- 306 )  15 。固定的一个bug那里multisearcher和parallelmultisearcher可    改变排序时,排序由字符串文件    价值为排序领域。      (吕克vanlerberghe途经yonik , Lucene的- 453 )  16 。固定一个排序问题multisearchers可导致    遗失或重复文档由于平等文档整理,在一个任意命令。      ( yonik斯利, Lucene的- 456 )  17 。一命中利用专家级分类检索方法    导致在分数不正常化。      ( yonik斯利, Lucene的- 462 )  18 。固定低效记忆体使用时加载一个指标纳入ramdirectory 。      (弗拉基米尔bychkoviak途经伯恩哈德Lucene的- 475 )  19 。更正任期冲抵经由chinesetokenizer 。      (光曾途经埃里克出雏, Lucene的- 324 )  20 。固定multireader.undeleteall ( ) ,以正确地更新numdocs 。      (罗伯特kirchgessner途经道格切割, Lucene的- 479 )  21 。竞赛条件indexreader.getcurrentversion ( )和iscurrent ( )     固定收购承诺锁定。      (吕克vanlerberghe途经yonik斯利, Lucene的- 481 )  22 。 indexwriter.setmaxbuffereddocs ( 1 )不具备预期效果时,     但这个问题已被固定。 (丹尼尔纳贝尔)  23 。固定queryparser当所谓的同一个日期,在当地形成像     " 2000年1月16日至2000年1月18日] " 。这个疑问并不包括文件    对2000年1月18日,即最后一天,是不包括在内。 (丹尼尔纳贝尔)  24 。拆除清理限制义无返顾一个例外,如果有    还没有任何价值,为排序字段( yonik斯利, Lucene的- 374 ) 优化       1 。磁盘使用(峰值要求在索引和优化)     在案件复合文件格式已得到改善。      (伯恩哈德德米特里,并克里斯多夫)   2 。优化性能的某些用途的booleanscorer ,      termscorer和indexsearcher 。特别是, booleanquery     组成termquery ,并非所有的条款规定,即返回一个     topdocs (例如,通过访问,没有指定排序)违背得多    速度更快。 (切割)       3 。拆除同步,从读任期向量与     indexreader (补丁编号30736 ) 。 (贝瀚梅塞尔途经克里斯多夫)   4 。优化一词字典查找拨出少得多的条件时,     扫描匹配。这将显着加快,涉及搜查    低频而言,如果成本字典查找,可    显着。 (切割)   5 。优化模糊查询,使标准模糊查询同一个前缀     0目前运行的20-50 %的速度(补丁编号31882 ) 。      (乔纳森hager途经丹尼尔纳贝尔)       6 。一种版本的booleanscorer ( booleanscorer2 )补充说,提供    文件中增加秩序,并实施skipto 。为疑问    符合要求或禁止的条文,它可能快过旧     booleanscorer , booleanqueries只可选    条文,它可能是比较慢。新booleanscorer现    默认。 (补丁31785保罗elschot途经克里斯多夫)   7 。使用uncached进入规范的时候,合并,以减少记忆体的使用情况。      (错误编号32847 ) 。 (道格切割)   8 。不看长远的指数时,随机存取不需要。这    缩短时间,以公开indexreaders ,他们使用更少的内存时,     随机存取不要求,例如,当合并环节。该    中期指数是现在读入内存懒惰在第一次    随机存取。 (道格切割)   9 。优化indexwriter.addindexes (目录[ ] )的时候,有多少    补充指标大于mergefactor 。以前这可能    结果在二次性能。现在的表现是n日志( n )的。      (道格切割)  10 。加快建立termenum为指标与多元    部分和删除文件,从而加快prefixquery ,      rangequery , wildcardquery , fuzzyquery , rangefilter , datefilter ,     和分拣第一时间对现场。      ( yonik斯利, Lucene的- 454 )  11 。优化和广义32位浮点运算,以字节     (定制8位浮点运算)的转换。上升速度     similarity.encodenorm ( )的任何地方,从10 %至250 % ,这取决于Java虚拟机。      ( yonik斯利, Lucene的- 467 ) 基础设施  1 。 Lucene的源代码文件已经转换,从cvs来    颠覆罪。新的存放处,是在     http://svn.apache.org/repos/asf/lucene/java/trunk   2 。 Lucene的的问题跟踪迁移从Bugzilla程序,以几种。      Lucene的的几种是在http://issues.apache.org/jira/browse/lucene     老问题仍在于     http://issues.apache.org/bugzilla/show_bug.cgi?id=xxxx      (使用错误序号不是为xxxx )  1.4.3   1 。 JSP的演示页面(钢骨混凝土/ JSP中/ results.jsp )现在妥善越狱误差    邮件可能含有用户输入(例如错误讯息约    查询解析) 。如果你使用该网页,以此为出发点贵    自己的代码请确保你的代码,还妥善越狱的HTML     汉字由用户输入,以避免使所谓的交叉网站    脚本攻击。 (丹尼尔纳贝尔)      2 。 queryparser变化1.4.2打破queryparser空气污染指数。现在老     空气污染指数是支持。 (克里斯多夫)  1.4.2   1 。固定的臭虫编号31241 :排序可能导致不正确结果(文件    失踪,其他人重复) ,如果排序键并非独一无二,并有    共100多场比赛。 (丹尼尔纳贝尔)   2 。内存泄漏在分类代码(错误编号31240 )淘汰。      ( rafal krzewski途经克里斯多夫和Daniel )       3 。 fuzzyquery现在需额外参数指明    最低相似,即要求一个任期,以配合查询。     该queryparser语法,因为这是长远的〜十,其中x是一个浮动    点数> = 0 < 1 (更大数量意味着更高    相似性是需要) 。再者,是一个前缀,可以指定    为fuzzyquerys所以只有那些条款被认为是类似的表示,     从这一前缀。这可以加快fuzzyquery很大。      (丹尼尔纳贝尔,克里斯多夫goller )       4 。 phrasequery和phraseprefixquery现在容许明确规范    相对的立场。 (克里斯多夫goller )       5 。 queryparser变化:见效arrayindexoutofboundsexceptions      (补丁# 9110 ) ,有的闲置方法参数拆除;能力    订定最低相似fuzzyquery已经被加入。      (克里斯多夫goller )   6 。 indexsearcher优化:一个新的scoredoc不再分配    对于每一个非0的得分击中。这使得'或'查询功能    包含共同条件大大加快。 (切割)  1.4.1   1 。固定表演臭虫在击中分类代码,如果价值观不    正确缓存。 ( aviran经切割)   2 。固定的错误文件格式的文件。 (丹尼尔纳贝尔)  1.4决赛  1 。补充说: "是一个"在该份名单中的停止词在stopanalyzer ,以补充    现行的" A " 。修理了臭虫28960       ( http://issues.apache.org/bugzilla/show_bug.cgi?id=28960 ) 。 (奥的斯)   2 。增加了新的阶级fieldcache管理,在记忆暗藏的领域任期    价值观。 (蒂姆琼斯)   3 。补充超载getfieldquery方法queryparser其中    接受模糊因子指定为词组(或默认    一语坡为queryparser举例) 。这使得压倒一切    方法,以取代phrasequery与spannearquery ,反而    保持适当的模糊因子。 (埃里克出雏机)   4 。改变了编码的germananalyzer.java和germanstemmer.java至     UTF - 8和改变了建立编码至UTF - 8 ,使修改过的文件    汇编。 (奥的斯gospodnetic )   5 。拆除同步,从长远查找下indexreader方法     termfreq ( ) , termdocs ( )或termpositions ( ) ,以改善    多线程性能。 (切割)   6 。确定一个错误:过时的部分档案被删除,并没有在Win32 。  1.4 rc3   1 。修正了几个搜索臭虫介绍所skipto ( )的变化    发布1.4rc1 。索引文件格式被改变一点,因此    藏品必须重新索引去利用这些skipto ( )     优化。 (克里斯多夫goller )   2 。增添了新文件的方法, removefield ( )和removefields ( ) 。      (克里斯多夫goller )   3 。固定不一致指数闭幕。索引和目录    现在只是关闭自动Lucene的时候, Lucene的开放    他们自动的。 (克里斯多夫goller )   4 。增加了新的班级: filteredquery 。 (蒂姆琼斯)   5 。增加了一个新的sortfield型,以定制比较。 (蒂姆琼斯)   6 。锁获得定时出讯息,现在显示全路径,以锁定    档案。 (丹尼尔经纳贝尔埃里克)   7 。固定的一个bug spannearquery当命令道。 (保罗elschot经切割)   8 。固定,使fsdirectory的一把锁,仍然有工作的时候     java.io.tmpdir系统财产是无效的。 (切割)   9 。改变filteredtermenum的constructor采取任何参数,     作为参数不被理会,反正(臭虫编号28858 )  1.4 RC2的  1 。 germananalyzer现在抛出一个例外,如果stopword档案    无法找到(错误编号27987 ) 。它现在已改用lowercasefilter      (错误编号18410 ) (丹尼尔纳贝尔途经奥的斯,埃里克)   2 。修补了几个错误,在文件格式的文件。 (切割)  1.4 rc1   1 。改变格式的。指令文件,使:      -它有一个格式的版本号码,这使得它更容易      后备兼容改变文件格式,在未来。      -任期指望的是,现在存储作为一项长期的。这是一个方面      该Lucene的的档案格式,这就限制了指数的大小。      -少数内部指标参数,现保存在索引中,使      他们可以(在理论上) ,现在改由指数编制索引,       虽然现时尚未有一个API这样做。     这些变化都是回兼容的。新的代码可以阅读岁    指标。但旧守则将无法读取新的指标。 (切割)   2 。补充,优化执行termdocs.skipto ( ) 。斗    表现保存每个学期中。 frq文件。这只能    增加了百分之或者两综合指数大小,但可大幅    加速许多搜查。 (切割)   3 。改组了分手API和所有分手的实施,采取    利用一个优化的termdocs.skipto ( )的实施。在    特别是, phrasequerys和结膜booleanquerys是    快时,其中一个条款已大大减少比赛比    等。 (一结膜booleanquery是booleanquery所有    条文规定) (切割)   4 。增加了新的阶级parallelmultisearcher 。结合     remotesearchable这使得它很容易实现分布式    搜索系统。 (让-弗朗索瓦阿勒经切割)   5 。增加的支持对于击中分拣。结果,可现在加以整理,任何    索引领域。细节见的Javadoc     探索者#搜索(查询,排序) 。 (蒂姆琼斯经切割)   6 。改变fsdirectory自动创建一个充满目录树,它    需要用mkdirs ( ) ,而不是mkdir ( ) 。 (姆拉登特克途经奥的斯)   7 。增加了一个新的跨度为基础的查询API 。这个执行,除其他    事情,嵌套短语。见的Javadoc细节。 (道格切割)   8 。增加了新的方法query.getsimilarity (探索者) ,并改变    分手来使用它。此证一亚纲质疑,使工人阶级    它可以指定自己相似的实施,或许    一说,代表们认为,通过的试练。 (朱利安尼奥什    经切割)   9 。补充multireader , indexreader即融合了多种其他     indexreaders 。 (切割)  10 。增加的支持对于任期载体。见场# istermvectorstored ( ) 。      (赠款英格索兰,切割和德米特里)  11 。固定老臭虫与逃逸的特殊字符质疑    弦乐: http://issues.apache.org/bugzilla/show_bug.cgi?id=24665      (让-弗朗索瓦阿勒途经奥的斯)  12 。补充支持,为压倒一切的默认值以下,     使用系统属性:        -默认犯下锁超时       -默认m axfieldlength        -默认m axmergedocs        -默认m ergefactor        -默认m inmergedocs        -默认写锁超时     (奥的斯)  13 。改变queryparser.jj让' -'和' + '内部令牌:      http://issues.apache.org/bugzilla/show_bug.cgi?id=27491      (桑沃尔特途经奥的斯)  14 。改变,使复合指数格式是默认使用。     这使得索引要慢一些,但大大降低了机会    档案处理问题。 (切割)  1.3决赛  1 。补充渔获booleanquery元toomanyclauses在queryparser至    扔parseexception代替。 (埃里克出雏机)   2 。定nullpointerexception在query.explain ( ) 。 (道格切割)   3 。增加了新的方法indexreader.setnorm ( ) ,允许一    改变刺激的领域后,指数就诞生了。   4 。区分最后职务高低,党龄长短,当索引1     场。长度,是目前被定义为总人数的筹码,     而不是最后的位置,因为它是以前。长度    用于评分正常化( similarity.lengthnorm ( ) ) ,并为    控制记忆体使用量( indexwriter.maxfieldlength ) 。在这两个    这些案件中,共有多少筹码是比较好的选择使用    超过最后象征性的立场。立场是,在用字    寻(见phrasequery和token.setpositionincrement ( ) ) 。   5 。修理standardtokenizer的处理展示CJK型快字(中文,     日语和韩语汉字组成) 。此前连续序列    被合并成一个单一的逻辑,这是不是非常有用。现在    每个字生成一个单独的道理,这是更为有益。  1.3 rc3   1 。补充minmergedocs在indexwriter 。这可以提高速度    引而不改变档案数目,但只能使用更    记忆体。 (朱利安尼奥什途经奥的斯)   2 。修正错误编号24786 ,查询重写。 ( bschneeman经切割)   3 。修正错误编号16952 ,在演示HTML解析器,跳过评论     JavaScript的。 (克里斯多夫goller )   4 。修正错误编号19253 ,在演示HTML解析器,地址空白,因为需要    输出(丹尼尔纳贝尔途经克里斯多夫goller )   5 。修正错误编号24301 ,在演示HTML解析器,长标题不再    坑的东西。 (克里斯多夫goller )   6 。修正错误编号23534 ,取代使用的文件时戳的部分档案    同一个指数,版本号码储存在部分档案。这    解决问题时,运行于文件系统的低分辨    时间戳,如居所资助计划下,在MacOS十(克里斯多夫goller )   7 。修理queryparser使tokenmgrerror不扔,只有     parseexception 。 (埃里克出雏机)   8 。修理一些臭虫推出改变11 RC2的。 (克里斯多夫goller )   9 。固定的一个问题汇编testrussianstem 。 (克里斯多夫goller )  10 。清理了一些建设的鬼话。 (埃里克出雏机)  1.3 RC2的  1 。补充getfieldnames (布尔) indexreader , segmentreader ,      segmentsreader 。 (朱利安尼奥什途经奥的斯)   2 。改变文件锁把锁在档案     system.getproperty ( " java.io.tmpdir " ) ,让所有用户    允许写入文件。这样,人们可以公开和正确    锁定指标是唯读给他们。   3 。 indexwriter :增加了一项新的方法, adddocument (文件,分析器)     允许一个轻松使用不同的分析工具,为不同    文件在同一指数。   4 。轻微增强fuzzytermenum 。      (克里斯多夫goller途经奥的斯)   5 。 priorityqueue :增加插入(对象)的方法和调整indexsearcher     和multiindexsearcher使用它。      (克里斯多夫goller途经奥的斯)   6 。固定的一个bug indexwriter ,归侨侨眷不正确doccount ( ) 。      (克里斯多夫goller途经奥的斯)   7 。固定segmentsreader消除混乱和略有不同    行为termenum在处理与枚举的所有条款,     银两枚举出发,从一个特定的任期。     这个补丁还修复了不正确任期文件时,频率相同,任期    目前在多个环节。      (克里斯多夫goller途经奥的斯)   8 。补充cachingwrapperfilter和perfieldanalyzerwrapper 。 (埃里克出雏机)   9 。补充支持,为新的"复合型档案"指数格式(德米特里    谢列布连尼科夫)  10 。补充,现场设置以queryparser ,使用日期范围解析。  11 。改变indexreader以便有需要时可子,由班    外面的包装物。此前,它已包公私    摘要方法。还修改了该指数合并守则,以便使它    可以工作,就武断地indexreader实施,并新增一个    新的方法, indexwriter.addindexes ( indexreader [ ] ) ,以接替    利用这一点。 (切割)  12 。增加了一个数量限制条款可能被加入到     booleanquery 。默认的上限是1024个条文。这应    停止大部分outofmemoryexceptions由前缀,通配符和模糊    疑问违背了肆意横行。 (切割)  13 。添加新的方法: indexreader.undeleteall ( ) 。这一切undeletes     删除文件仍留在指数。 (切割)  1.3 rc1   1 。固定priorityqueue的明确( )方法。     修理臭虫9454年, http://nagoya.apache.org/bugzilla/show_bug.cgi?id=9454      ( matthijs博霍夫途经奥的斯)   2 。改变standardtokenizer.jj文法电子邮件令牌。     修理臭虫9015年, http://nagoya.apache.org/bugzilla/show_bug.cgi?id=9015      (戴方安生途经奥的斯)   3 。补充能力要禁用锁创作用disablelucenelocks     系统特性。这是有益的,为唯读媒介,例如唯读光碟。      (奥的斯)   4 。补充身份证法访问,以能够获得该指数全球身份证。     所需的排序选项。      (卡尔森)   5 。补充支持,为新的远程查询语法,以queryparser.jj 。      ( briangoetz )   6 。补充能力检索HTML文件' meta标签价值观     htmlparser.jj 。      (马克哈伍德途经奥的斯)   7 。改性queryparser ,以使人们有可能以编程明    默认布尔算子(或或和) 。      ( péter halácsy途经奥的斯)   8 。提出了许多搜索方法及班级非决赛中,每请求。     这包括indexwriter和indexsearcher ,等等。      (切割)   9 。补充级remotesearchable ,提供支援边远    寻找途经RMI的。测试级remotesearchabletest.java     提供了一个例子,说明这都可以使用。 (切割)   10 。补充phraseprefixquery (和支持multipletermpositions ) 。该     测试级testphraseprefixquery提供使用示例。       (安德斯尼尔森途经奥的斯)   11 。改变了德国产生的算法忽略的情况,而     剥离。新算法的速度和产生更平等     源于名词和动词源于同一个词。       ( gschwarz )   12 。补充支持,为提高评分的文件,并经领域     这种新方法document.setboost (浮)和field.setboost (浮) 。      注:这改变了编码的一个索引值。指标     应该重新从零开始去创造,为使搜索分数     正确的。与新的代码和一个旧指数,将搜查     产量非常大的分数更短的领域,并非常小的分数     作较长时间的领域。一旦该指数是重新创建,分数会     一如以往。 (切割)   13 。增加了新的方法token.setpositionincrement ( ) 。      此证为目的,短语搜索,配售     多重条件在一个单一的位置。这是有益的同      stemmers产生多种可能源于一个字。      这还允许引进之间的差距计算,使     术语是在毗邻的一份心意流将不会配合     精确短语查询。这使得它有可能,例如,要建设     分析器那里句子不匹配超过停止词,其中     已被剔除。      最后,重复一份心意与增量为零也可以     用来提高分数的比赛就这一道理。 (切割)   14 。增加了新的过滤级, queryfilter 。这制约着搜索     结果只匹配那些还匹配提供查询。      结果缓存,使搜查后,先于同     指数使用这种过滤器是非常快的。      这可以用来,例如,一个rangequery对格式化     日期栏实施日期过滤。人们可以重新使用     单queryfilter相匹配,例如,只有文件的修改     在过去一周。该queryfilter和rangequery只会     需要加以改原本的每一天。 (切割)   15 。增加了一个新的indexwriter方法, getanalyzer ( ) 。这个返回     分析器使用时加入文件,以这个指数。 (切割)   16 。固定的一个bug与indexreader.lastmodified ( ) 。之前,文件     删除不更新这个地方。现在它需要。 (切割)   17 。补充说,俄罗斯分析器。       (鲍里斯奥克纳途经奥的斯)   18 。增加了公共性,可扩展得分空气污染指数。详情请参阅     的Javadoc org.apache.lucene.search.similarity 。   19 。固定回报的hits.id ( )从浮点数诠释。 (特里steichen途经彼得) 。   20 。补充getfieldnames ( ) indexreader及分部( )阅读班。       (彼得mularien途经奥的斯)   21 。补充getfields (字符串)和getvalues (字符串)的方法。      贡献rasik潘迪于2002年10月9日      ( rasik潘迪途经奥的斯)   22 。经修订的内部搜索API 。转变包括:        答:疑问不再修饰在搜查。这使得       它可能的,例如,再用同样的问题,例如与       多指标,从多线程。        乙任期扩大疑问(如prefixquery , wildcardquery ,        等等) ,现在的工作,正确与multisearcher ,定影臭虫12619        和12667 。        长刺激booleanquery的,现在工程,并得到了       单项查询(问题报道,由李mallabone ) 。因此质疑       如" ( +富+酒吧) ^ 2 + baz把"现正支持和相当于        " ( +富^ 2 +酒吧^ 2 ) + baz把" 。        四新的方法: query.rewrite ( indexreader ) 。这允许       查询重写本身作为候补,更原始些。        大部分的任期膨质疑班( prefixquery ,         wildcardquery等) ,现正推行使用这种方法。        体育新的方法: searchable.explain (查询q ,诠释DOC )的。这       返回一个解释,举例说明如何在特定       文件是对成绩查询。一个解释,可       表现为无论是纯文本,与tostring ( )方法,或       为HTML格式,与tohtml ( )方法。注意计算       解释是因为昂贵作为执行查询比       整个指数。这是打算用来开发       相似的实现,并为好的表现,应       不能够显示每击中。        楼射手和重量是公众,而不是一揽子保障。现在       可能有人写一分手,执行,即       而不是在org.apache.lucene.search封装。这仍是       较为先进的编程,我不期望任何人做       这在近期内,但至少现在这是可能的。         g.补充,市民存取器,以加强原始性质疑班        ( termquery , phrasequery和booleanquery ) ,允许进入       他们的条件和条款。      注意:这是广泛的变化和它们尚未被     广泛的测试。错误报告是值得赞赏的。       (切割)   23 。更加方便ramdirectory建设者以文件和字符串     论据,为方便fsdirectory以ramdirectory转换。       (奥的斯)   24 。补充代码手册改名档案fsdirectory ,因为它     有报道说, java.io.file奇摩renameto (档案)的方法,有时     未能于Windows jvms 。       (马特塔克途经奥的斯)   25 。 refactored queryparser ,以使人们更容易把它扩大。      补充,能够自动降低的情况下,通配符条款     该queryparser 。       ( tatu saloranta途经奥的斯)  1.2 rc6   1 。改变queryparser.jj有" ? "是一个特殊的字    任由它被用来作为通配符任期。更新testwildcard     单元测试也。 (拉尔夫hettesheimer途经卡尔森)  1.2 rc5   1 。更名为build.properties以default.properties和更新    该build.txt文件描述如何凌驾于     default.property设置,而不必编辑该文件。这    把构建过程更接近于金龟子的建设进程。      (琼)   2 。补充multifieldqueryparser阶层。 (开尔文谭,途经奥的斯)   3 。最新的"动力"的链接。 (奥的斯)   4 。固定的指令设立javacc -错误编号7 017(奥的斯)   5 。补充投掷例外,如果fsdirectory能不能创造新的目录     -错误编号6 914(尤金g luzberg途经奥的斯)   6 。更新multisearcher , multifieldparse ,常数, datefilter ,      lowercasetokenizer与JavaDoc (奥的斯)   7 。补充修正,以避免nullpointerexception在results.jsp      (马克海斯途经奥的斯)   8 。改变通配符搜索找到0个或多个字符而不是1或更多     (李mallobone ,途经奥的斯)   9 。固定误差抵消问题germanstemfilter -错误编号7 412      (罗德里戈雷耶斯,途经奥的斯)   10 。补充单元测试,为通配符搜索和datefilter (奥的斯)   11 。允许共存的索引和非索引领域具有相同名称      (切割/凯斯伯,途经奥的斯)   12 。加上逃生品格,以单项查询。       ( briangoetz )   13 。应用补丁程序,以确保搜索使用datefilter      不要抛出一个例外时,没有火柴被发现。 (大卫笑脸,经     奥的斯)   14 。固定的臭虫在datefilter和wildcardquery单元测试。 (切割,奥的斯,卡尔森)  1.2的RC4   1 。更新缴款科的网站。     放入XML文件# 3执行文件科。     还增加了任期突出,以国际船务科。 (卡尔森)   2 。固定nullpointerexception为短语搜索含有    未与条款,引入1.2rc3 。 (切割)   3 。改变文件删除代码,以获得该指数写锁,     执法事实,即除了文件,并删除不能    演出兼任。 (切割)   4 。各种文件清理。 (奥的斯, acoliver )   5 。最新的"动力"的链接。 (切割,琼)   6 。固定的一个bug在germanstemmer 。 (贝瀚梅塞尔,途经奥的斯)   7 。改变一词,并质疑实行Serializable的。 ( scottganyo )   8 。固定将永远不会删除指标的补充与indexwriter.addindexes ( ) 。      (切割)   9 。升格为junit 3.7 。 (奥的斯)  1.2 rc3   1 。 indexwriter :固定的一个错误的地方,加入一个优化指标,以一个    空指数都失败了。这是遇到使用addindexes复制     1 ramdirectory指数,以一个fsdirectory 。   2 。 ramdirectory :固定一个bug那里raminputstream不能读    全国超过全国单个缓冲区的边界。   3 。修理单项查询,所以它接受质疑与Unicode字符。      ( briangoetz )   4 。修理单项查询,使prefixquery是优先使用     wildcardquery当有唯一的一个星号于去年底的    任期。以前prefixquery将永远不再使用。   5 。修理试验,让它们汇编;修理蚂蚁文件,所以编译测试    妥善。补充测试案例分析仪和priorityqueue 。   6 。最新演示,补充起步文件。 ( acoliver )   7 。补充说: '贡献'节网页及文件。 (卡尔森)   8 。拆除javacc从源分布,为版权的原因。     乡亲现在必须下载本分开metamata以    编译Lucene的。 (切割)   9 。大大改善了性能datefilter加入    能力重用termdocs物体。 (切割)  10 。补充indexreader方法:       公共静态布尔indexexists (弦乐目录) ;       公共静态布尔indexexists (档案目录) ;       公共静态布尔indexexists ( Directory目录) ;       公共静态布尔islocked ( Directory目录) ;       公共静态无效解锁( Directory目录) ;      (切割,奥的斯)  11 。固定的臭虫在germananalyzer ( gschwarz )  1.2 RC2的, 2001年10月19日:   -补充来源分布  -拆除破碎建立脚本和图书馆的分布  -s egmentsreader:固定潜力的竞赛条件  -f sdirectory:固定,使g etdirectory(第X XX号属实)正确   除去该目录的内容,甚至当目录   已被浏览本JVM的。   -r angequery:定位问题,而一个包容各种质疑会   包括就近的来说,该指数高于非existant    特定上来说。   -s egmenttermenum:定位n ullpointerexception在克隆( )方法。    当一词是无效的。   -的J DK1 .1兼容性修正:残疾人锁定档案的J DK1 .1,    因为它们依靠的一个特点,在补充的JDK 1.2 。  1.2 rc1 (第一阿帕奇释放) , 2001年10月2日:    -包更名,由c om.lucene以o rg.apache.lucene    -牌照转由L GPL(以阿帕奇   -蚂蚁只兴建-没有更多的M a kefile中   -增加锁档案-现在已完全螺纹及过程安全   -此外,德国s temmer    -m ultisearcher现在支持低层次的A PI搜索   -补充r angequery,为长远的远程检索   -分析器可以选择t okenizer基于现场名称   -其它b ug修复。  1.01b (最后的SourceForge版本) , 2001年7月2日  。几个bug修复  。新的查询分析器  。新的前缀查询(搜索"富* "匹配"食品" )  1.0 , 2000年10月4日此版本修正了几个严重的错误,也包括一些性能优化, stemmer ,和其他几个小增强功能。  0.04 2000年4月19日 Lucene的,现在包括语法基于tokenizer , standardtokenizer 。 唯一tokenizer列入前发布( lettertokenizer ) 确定条款构成的全是英文字母。该新tokenizer使用正规表达式的语法,以找出更多综合班的条件,包括号码,缩略语,电子邮件地址等。  standardtokenizer有两个目的:   1 。这是一个很大的改善,一般用途tokenizer使用    申请。     最简单的方法,为应用程序开始使用     standardtokenizer是利用standardanalyzer 。   2 。它提供了一个很好的例子,文法基于tokenization 。     如果申请有特殊tokenization要求,它可以    实施定制tokenizer用拷贝目录包含    新tokenizer进入应用并修改它    据此。  0.01 , 2000年3月30日第一开放源代码发布。 代码已经重新组织成一个新的软件包和目录结构本新闻稿。它建立好,但还没有经过测试以后,由于重新组织。 http://www.qyxxpd.com
原创粉丝点击