Lucene2.3的变化日志

来源：互联网发布：深圳市阿里云大厦饺子编辑：程序博客网时间：2024/04/29 01:46
Lucene的变化日志元身分元 =======================释放2.3.0 2008年1月23日================== ===== 变化在运行时的行为  1 。 Lucene的- 994 ：默认为indexwriter已被更改，以最大限度地    出先进的系统盒索引速度。首先， indexwriter现在冲所     RAM的使用量（ 16 MB的默认） ，而不是一个固定的文件计数（呼叫     indexwriter.setmaxbuffereddocs获得向后兼容    行为） 。第二， concurrentmergescheduler是用于运行合并    利用后台线程（呼叫indexwriter.setmergescheduler （新     serialmergescheduler （ ） ） ，以获得向后兼容行为） 。     第三，并购是选择的基础上的规模字节的每一部分    而非文件计数的每一部分（呼叫     indexwriter.setmergepolicy （新logdocmergepolicy （ ） ） ，以获得    向后兼容行为） 。     注：用户parallelreader必须改变回所有这些    拖欠，以确保docids "对齐" ，所有并行    指数。      （迈克mccandless ）   2 。 Lucene的-在1045 ： sortfield.auto没有工作，与长。当检测    外地类型自动排序，有多少曾经被    解释为诠释，那么，作为自由浮动，如果解析人数作为诠释    失败了。现在的检测检验诠释，那么，时间不长，     然后浮法。 （丹尼尔纳贝尔） 空气污染指数的变化  1 。 Lucene的- 843 ：补充indexwriter.setrambuffersizemb (...)有     indexwriter冲水每当缓冲文件，多用    超过规定数额的RAM 。还增加了新的宣传短片，以象征性    它们允许一个确定一个烧焦[ ]加偏移和长度指定    令牌（以避免创造一个新的字符串（ ） ，为每一个令牌） 。 （迈克     mccandless ）   2 。 Lucene的- 963 ：添加二传手到外地，让重新使用一个单一的    外地例如，在索引。这是一个可观的业绩    增益，特别是对小文件。 （迈克mccandless ）   3 。 Lucene的- 969 ：添加新的API道理， tokenstream和分析仪    证重新使用的令牌和tokenstream事例在    索引。改变心意用炭[ ]作为存储为     termtext而不是字符串。这使更快tokenization     表演（ 〜 10-15 ％ ） 。 （迈克mccandless ）   4 。 Lucene的- 847 ：意料之中mergepolicy的，这就决定了兼并    应采取的地点和时，以及mergescheduler ，     决定何时选定合并应实际运作，但出于     indexwriter 。默认合并政策现     logbytesizemergepolicy （见Lucene的- 845 ）和预设合并    调度器是现在concurrentmergescheduler （见     Lucene的- 870 ） 。 （潘国加士透过麦克mccandless ）   5 。 Lucene的- 1052 ：添加indexreader.setterminfosindexdivisor （ int ）的方法    可以让你减少记忆体使用的terminfos进一步    子采样（超过termindexinterval被用来在    索引） ，其中的条款，装载到内存中。 （夹头威廉姆斯，     道格切割透过麦克mccandless ）       6 。 Lucene的- 743 ：添加indexreader.reopen （ ）的方法，重新打开    现有indexreader （见新的特点-> "八） （迈克尔布希公司）   7 。 Lucene的- 1062年：加入setdata （字节[ ]数据） ，      setdata （字节[ ]的数据，诠释抵消，诠释长度） ， getdata （ ） ， getoffset （ ）     与克隆（ ）方法，以o.a.l.index.payload 。还添加字段名称    由于阿根廷以similarity.scorepayload （ ） 。 （迈克尔布希公司）   8 。 Lucene的- 982 ：添加indexwriter.optimize （ int起点maxnumsegments ）方法     "局部优化"的一个指标下降至maxnumsegments环节。      （迈克mccandless ）   9 。 Lucene的- 1080 ：改变token.default_type定为公。  10 。 Lucene的- 1064 ：改变topdocs构造被公开。       （帅erera途经迈克尔布希公司）  11 。 Lucene的- 1079个： docvalues清理：构造器，现在已经没有params ，     和getinnerarray （ ） ，现在全unsupportedoperationexception （多伦科恩）  12 。 Lucene的- 1089 ：补充priorityqueue.insertwithoverflow ，他返回    对象（如果有的话） ，这是相碰，从排队，让    重新使用。 （帅erera透过麦克mccandless ）      13 。 Lucene的- 1101 ：令牌重用'合同' （指Lucene的- 969 ）     修改，以便它是象征性的生产者的责任    请token.clear （ ） 。 （多伦科恩）  14 。 Lucene的- 1118 ：改变standardanalyzer跳过太龙（默认>      255个字符）令牌。你可以增加此限拨电话     standardanalyzer.setmaxtokenlength (...). （迈克尔mccandless ）  bug修复  1 。 Lucene的- 933 ： queryparser固定将不会产生空分     booleanqueries " （ ） " ，即使分析器产生任何    代币投入。 （多伦科恩）   2 。 Lucene的- 955 ：固定segmenttermpositions工作正确与    第一任期在字典里。 （迈克尔布希公司）   3 。 Lucene的- 951 ：固定nullpointerexception在multilevelskiplistreader     这是投掷后的呼唤termpositions.seek （ ） 。      （富有约翰逊途经迈克尔布希公司）       4 。 Lucene的- 938 ：固定的情况下，一个unhandled例外     indexwriter的方法可能会导致删除，以丢失。      （潘国加士透过麦克mccandless ）         5 。 Lucene的- 962 ：固定的情况下，一个unhandled例外     indexwriter.adddocument或indexwriter.updatedocument可能导致     unreferenced档案，在该指数将不会被删除     （潘国加士透过麦克mccandless ）     6 。 Lucene的- 957 ： ramdirectory固定要妥善处理好目录    大于integer.max_value 。 （多伦科恩）   7 。 Lucene的- 781 ： multireader固定，以不丢的NPE如果iscurrent （ ） ，      isoptimized （ ）或getversion （ ）被调用。失散multireader     分为两个档次： multisegmentreader延伸indexreader ，是    整套保护，并创造自动indexreader.open （ ）     在情况下，指数有多个环节。市民multireader     现已扩展到multisegmentreader是打算用来用户    那些想增加他们自己的subreaders 。 （丹尼尔纳贝尔，迈克尔布希公司）   8 。 Lucene的- 970 ： filterindexreader现在实行isoptimized （ ） 。前    打电话的isoptimized （ ）会扔北角。 （迈克尔布希公司）   9 。 Lucene的- 832 ： parallelreader固定，以不丢的NPE如果iscurrent （ ） ，      isoptimized （ ）或getversion （ ）被调用。 （迈克尔布希公司）        10 。 Lucene的- 948 ：定位fnfe例外所造成的陈腐NFS的客户端    名录中暗藏当作家，在不同的机器上都    分享指数超过NFS和使用定制删除政策（迈克     mccandless ）  11 。 Lucene的- 978 ：确保terminfosreader ， fieldsreader ， fieldsreader     关闭任何溪流中，他们拓宽了，如果是一个例外，射中    构造方法。 （李宁透过麦克mccandless ）  12 。 Lucene的- 985 ：如果一个非常长远的，是在一个文件（ " > 16383字）     我们现在抛出一个illegalargumentexception说一词，是太    长期以来，而不是潜arrayindexoutofboundsexception 。 （卡尔。      wettin透过麦克mccandless ）  13 。 Lucene的- 991 ：解释（ ）方法boostingtermquery有错误    当没有有效载荷人出席一份文件。 （彼得基冈经    金英格索兰）  14 。 Lucene的- 992 ：固定indexwriter.updatedocument将原子再次     （这是打破Lucene的- 843 ） 。 （李宁透过麦克mccandless ）  15 。 Lucene的- 1008 ：固定腐败案文件时，没有任期    向量场是补充文件后，与长远的向量场。     这个bug提交与Lucene的- 843 。 （赠款英格索兰经    麦克mccandless ）  16 。 Lucene的- 1006 ：固定queryparser接受" ， "外地值（零    长度引述弦） （ yonik ）  17 。 Lucene的1010 ：固定腐败案文件时，没有任期    向量场是补充文件后，与长远的向量场。     这件事的打击，合并，并会造成eofexception 。     这个bug提交与Lucene的- 984 。 （安迪vajda途经迈克     mccandless ）  19 。 Lucene的- 1009 ：定合并缓慢logbytesizemergepolicy时     autocommit =虚假和文件都是使用存储领域和/或任期    载体。 （马克米勒透过麦克mccandless ）  20 。 Lucene的-第1011 ：固定贪污案件时，两个或两个以上的机器，     分享指数超过NFS的，可作家接踵而来。      （帕特里克kimber透过麦克mccandless ）  21 。 Lucene的- 1028 ：固定重量，系列化，为几个疑问：      disjunctionmaxquery ， valuesourcequery ， customscorequery 。     连载核对补充，为所有疑问。      （凯尔麦克斯韦通过多伦科恩）  22 。 Lucene的- 1048 ：固定不正确行为lock.obtain (...)当    超时说法是非常大的（如long.max_value ） 。还补充说：      lock.lock_obtain_wait_forever常数从来没有超时。 （尼古拉     diakov透过麦克mccandless ）  23 。 Lucene的1050 ：扔在lockreleasefailedexception     简单/ nativefslockfactory如果我们不能删除锁定文件时，     释放锁。 （尼古拉diakov透过麦克mccandless ）  24 。 Lucene的-七一：固定segmentmerger正确一套有效载荷位    合并后部分。 （迈克尔布希公司）  25 。 Lucene的- 1042 ：移除投掷的ioexception在gettermfreqvector （ int起点，弦乐， termvectormapper ） ，以保持一致    与其他gettermfreqvector来电。还取消了投掷的其他ioexception在这一方法是一致的。 （卡尔wettin途经金英格索兰）      26 。 Lucene的1096 ：定额点击行为时，点击'文件被删除    随着迭代的命中目标。删去文档已经名词    现在工程无缝。如果文档尚未名词被删除     （例如：从另一个线程） ，然后，依靠初始     hits.length （ ） ，申请企图取回详情Hits     比实际存在的，一个concurrentmidificationexception     是抛出。 （多伦科恩）  27 。 Lucene的- 1068 ：改变standardtokenizer向被告问题，它标志着  该类型的一些令牌错误。这样做增加了新的国旗命名   replaceinvalidacronym默认为虚假的，目前，不正确行为。设置  这个旗的真正修复这个问题。这个旗是一个临时的解决，并已  标记为已被废弃了。 3.x将实施正确的做法。 （帅erera途经金英格索兰）    Lucene的- 1140 ：固定北角造成1068 （阿列克谢它的经批英格索兰）      28 。 Lucene的- 749 ： chainedfilter行为时，固定的逻辑    首先过滤器是andnot 。 （安东尼奥布鲁诺途经多伦科恩）  29 。 Lucene的- 508 ：确保segmenttermenum.prev （ ）是准确的（ =上    任期）后，明年（ ）返回false 。 （潘国tamm途经迈克     mccandless ）     新功能  1 。 Lucene的- 906 ： elision滤波器为法语。      （马丢勒卡尔姆途经奥的斯gospodnetic ）   2 。 Lucene的- 960 ：加了spanqueryfilter及相关班级，让    不仅过滤，但不知在一份文件，一个过滤火柴     （赠款英格索兰）   3 。 Lucene的- 868 ：增加新的任期内向量接入功能。新的回调    机制允许应用以确定如何以及在哪里看长远    载体从磁盘。本实施包含几个扩展    根据新摘要termvectormapper阶层。新的空气污染指数应    回到兼容的。没有变化，在实际储存的任期载体    确已发生。   3.1 Lucene的- 1038年：增加setdocumentnumber （ ）方法来termvectormapper      提供资料，有什么文件正在访问。       （卡尔wettin途经金英格索兰）   4 。 Lucene的- 975 ：补充positionbasedtermvectormapper允许    立场基于查表的任期向量信息。     见项目编号3段（ Lucene的- 868 ） 。   5 。 Lucene的-第1011 ：新增简单工具（都在org.apache.lucene.store ）     核实锁定工作正常。 lockverifyserver背道而驰    一个单独的服务器来验证门锁。 lockstresstest运行一个简单    工具，迅速获取和发布的门锁。      verifyinglockfactory是lockfactory即包裹任何其他     lockfactory和咨询lockverifyserver每当锁    取得或释放，抛出一个例外，如果一个非法锁    获得发生。 （帕特里克kimber透过麦克mccandless ）   6 。 Lucene的- 1015 ：补充fieldcache支线（ extendedfieldcache ）     支持双打和多头。补充支持，到sortfield整治方案    对双打和多头以及。 （赠款英格索兰）   7 。 Lucene的- 1020 ：创造了基本指标检测与维修工具     （ o.a.l.index.checkindex ） 。在运行时没有固定，它不利于    详细测试的所有环节在指数和报告摘要    信息与任何错误，它击中。与修补，它会移除    部分曾错误。 （迈克mccandless ）   8 。 Lucene的- 743 ：添加indexreader.reopen （ ）的方法，重新打开    现有indexreader只装载的那部分索引    这改变了自读者是（重新）举行开幕仪式。重开（ ） ，可    大大快于开放式（ ） ，视金额的    指数的变化。 segmentreader ， multisegmentreader ， multireader ，     和parallelreader落实重开（ ） 。 （迈克尔布希公司）   9 。 Lucene的- 1040 ： chararrayset有益的，以便有效地遏制    设籍的文本指明烧焦[ ] 。 （ yonik ）  10 。 Lucene的- 1073 ：创造snapshotdeletionpolicy ，以方便走    活备份的一个指标，没有停索引。 （迈克     mccandless ）      11 。 Lucene的- 1019 ： customscorequery加强，以支援多种     valuesource疑问。 （凯尔麦克斯韦通过多伦科恩）      12 。 Lucene的- 1095 ：增加一个选择stopfilter增加     positionincrement的令牌接替暂停道理。     残疾人默认。类似的选项中加入queryparser     考虑象征性职位，当创建phrasequery     和multiphrasequery 。残疾人默认（所以默认    查询解析器忽略立场递增） 。      （多伦科恩）  优化  1 。 Lucene的- 937 ： cachingtokenfilter如今采用迭代访问    令牌是缓存在linkedlist 。这都增加了业绩    显着的，尤其是当有多少筹码是大。      （马克米勒途经迈克尔布希公司）   2 。 Lucene的- 843 ：大幅度优化，以改善如何indexwriter     使用内存为缓冲文件，并加速索引（ 2倍- 8倍速    更快） 。一个单一的共享哈希表现记录在记忆体    每张贴独特的任期，并直接冲入成一个单一    部分。 （迈克mccandless ）    3 。 Lucene的- 892 ：固定额外的"缓冲区到缓冲区拷贝" ，有时候    发生时，使用复合文件。 （迈克mccandless ）   4 。 Lucene的- 959 ：移除同步文件（ yonik ）   5 。 Lucene的- 963 ：添加二传手到外地，让重新使用一个单一的    外地例如，在索引。这是一个可观的业绩    增益，特别是对小文件。 （迈克mccandless ）   6 。 Lucene的- 939 ：检查明确为边界条件fieldinfos     和不依赖例外。 （迈克尔布希公司）   7 。 Lucene的- 966 ：十分可观的加速比（ 〜 6倍快）      standardtokenizer （ standardanalyzer ）用jflex而非     javacc生成tokenizer 。      （ stanislaw奥辛斯基透过麦克mccandless ）   8 。 Lucene的- 969 ：改变核心tokenizers与滤波器，以重新使用，并象征性     tokenstream事例时，有可能改善tokenization     表演（ 〜 10-15 ％ ） 。 （迈克mccandless ）   9 。 Lucene的- 871 ：加速isolatin1accentfilter （伊恩波士顿途经迈克     mccandless ）  10 。 Lucene的- 986 ： refactored segmentinfos从indexreader纳入新的    亚纲directoryindexreader 。 segmentreader和multisegmentreader     现在延长directoryindexreader是唯一indexreader     建置使用segmentinfos接入指数和    获得写锁，为指数的修改。 （迈克尔布希公司）  11 。 Lucene的- 1007 ：请允许冲厕indexwriter可触发    要么RAM的用法或文件计数或两者（后者    第一） ，加上象征性不断disable_auto_flush禁用    其中的冲水诱因。 （李宁透过麦克mccandless ）  12 。 Lucene的- 1043 ：加快合并的存储领域，由散装抄袭    原料字节为每个连续的一系列非删除文件。      （罗伯特恩格斯通过麦克mccandless ）  13 。 Lucene的- 693 ：加快嵌套连词（ 〜 2倍） ，那场比赛有很多    文件，并有轻微的性能提升，为高层    连接词。 （ yonik ）  14 。 Lucene的- 1098 ：内部类standardanalyzer.savedstreams静    为最终决定。 （弥敦道beyer途经迈克尔布希公司） 文件  1 。 Lucene的- 1051 ：生成单独的Javadoc核心，演示和contrib请    班，以及作为一个统一的看法。同时添加适当的菜单    结构，以该网站。 （迈克尔布希公司）   2 。 Lucene的- 746 ：定位错误讯息，在analyzingqueryparser.getprefixquery 。      （柏霆科勒赫迈宁途经迈克尔布希公司） 建设  1 。 Lucene的- 908 ：改进和简化为如何体现    档案和梅塔-干扰素迪尔创造。 （迈克尔布希公司）   2 。 Lucene的- 935 ：各项改善工作，为行家文物。现在    文物，还包括来源。 JAR文件。 （迈克尔布希公司）   3 。补充申请-贴片目标，以高层建。默认为寻找    补丁程序，在$ （ basedir }/../补丁名称指明- dpatch.name 。     还可以指定在任何地点- dpatch.file财产上的指挥    线。这应该是有帮助的，方便适用的补丁，但它    也是迈向整合自动贴片与应用    几种和Hudson ，因此，这是可能随时变动。 （赠款英格索兰）    4 。 Lucene的- 935 ：界定财产" m2.repository.url " ，让定    该网址向行家远端部署。 （迈克尔布希公司）   5 。 Lucene的- 1051 ：包含的Javadoc在行家文物。 （迈克尔布希公司）   6 。 Lucene的- 1055 ：移除gdata服务器，从建立档案及其来源    从躯干。 （迈克尔布希公司）   7 。 Lucene的- 935 ：首先，请允许部署行家文物到一个偏远的货币供应量M2存放处    途经的SCP和SSH认证。 （迈克尔布希公司）    8 。 Lucene的- 1123年：首先，请允许压倒一切的规格版本     manifest.mf （迈克尔布希公司） 测试案例  1 。 Lucene的- 766 ：测试，加入这两个领域与同名同姓，但不同    任期向量设置。 （尼可拉斯lalevée途经多伦科恩）      =======================释放2.2.0 2007-06-19 ================== ===== 变化在运行时的行为空气污染指数的变化  1 。 Lucene的- 793 ：创造了新的例外和补充，他们投掷第    对于许多方法（所有子ioexception为倒退    兼容性） ： index.stalereaderexception ，      index.corruptindexexception ， store.lockobtainfailedexception 。     这样做的目的是更好地呼吁找出可行的根源，是一个     ioexception从这些方法。 （迈克mccandless ）   2 。 Lucene的- 811 ：珍爱segmentinfos一流的，再加上几个方法，由相关    班，包私人再次（他们不必要公开    由于部分Lucene的- 701 ） 。 （迈克mccandless ）   3 。 Lucene的- 710 ：增加可选autocommit布尔以indexwriter     建设者。如果这是假的，指数变化不承诺    直到作家收盘。这给了明确的控制时，     读者将会看到的变化。还增加了可选的定制    删除政策，以明确控制的时候，事先承诺是    清除出指数。这是为了让申请    股票指数超过安装NFS定制时，事先承诺是    删除。 （迈克mccandless ）   4 。 Lucene的- 818 ：改变了大多数公共方法indexwriter ，      indexreader （及其子类） ， fieldsreader和ramdirectory至    扔alreadyclosedexception如果他们进入后，     封闭。 （迈克mccandless ）   5 。 Lucene的- 834 ：改变了一些市场准入水平，为某些跨度班，让他们有    被否决。他们已显着专家只，不为公众    消费。 （赠款英格索兰）   6 。 Lucene的- 796 ：除去通话超级.*来自各获得*查询方法     multifieldqueryparser ，为了让子班，以凌驾他们。      （潘国加士途经奥的斯gospodnetic ）   7 。 Lucene的- 857 ：清除缓存从queryfilter和废弃queryfilter     赞成querywrapperfilter或querywrapperfilter + cachingwrapperfilter     组合时，贮藏，是理想的。      （克里斯hostetter ，奥的斯gospodnetic ）   8 。 Lucene的- 869 ：改变fsindexinput和fsindexoutput向内蒙古班的fsdirectory     为了使可扩展性，这些班级。 （迈克尔布希公司）   9 。 Lucene的- 580 ：新增公共方法复位（ ） tokenstream 。这个方法    没有默认，但可能被覆盖由亚，以支持消费    该tokenstream一次以上。 （迈克尔布希公司）  10 。 Lucene的- 580 ：增加了一个新的构造器，以现场即需tokenstream作为    论据，可作为tokenstreamvalue （ ） 。这是有益的，以避免必要的     "虚拟分析仪" ，为预分析领域的合作。 （卡尔wettin ，迈克尔布希公司）  11 。 Lucene的- 730 ：增加了新的方法，以booleanquery setallowdocsoutoforder （ ）      getallowdocsoutoforder （ ） 。已废弃的方法setusescorer14 （ ）      getusescorer14 （ ） 。优化补丁Lucene的- 730 （见优化" -> 3 ） 。     提高性能为若干疑问，但结果得分列的docid     秩序。这个补丁扭转这种改变，因此，现在默认击中文档得分    在docid秩序，如果没有setallowdocsoutoforder （属实） ，是明确要求。     这个补丁也使测试queryutils再次检查docid     秩序。 （保罗elschot ，多伦科恩，迈克尔布希公司）  12 。 Lucene的- 888 ：补充directory.openinput （文件路径，诠释buffersize ）     以选择性地指定大小的读取缓冲区。还补充说：      bufferedindexinput.setbuffersize （ int ）的改变缓冲区大小。      （迈克mccandless ）  13 。 Lucene的- 923 ：珍爱segmenttermpositionvector一揽子公私。它不需要    要公开，因为它实现了公共接口termpositionvector 。      （迈克尔布希公司）  bug修复  1 。 Lucene的- 804 ：固定build.xml收拾一个完全compilable钢骨混凝土的dist 。 （多伦科恩）   2 。 Lucene的- 813 ：领导通配符固定工作，与拖尾通配符。     单项查询修改，以创造一个前缀质疑只为案例    有一个单一的拖尾通配符（也没有额外的通配符    或'吗？在查询文本） 。 （多伦科恩）   3 。 Lucene的- 812 ：添加无说法建设者以nativefslockfactory     和simplefslockfactory 。这使得所有4个内嵌式lockfactory     实现向指定经系统特性     org.apache.lucene.store.fsdirectorylockfactoryclass 。 （迈克mccandless ）   4 。 Lucene的- 821 ：新的单规范档案介绍Lucene的- 756     失败的次数减少了开放式叙词，因为它仍是    开每场的规范。 （ yonik ）   5 。 Lucene的- 823 ：确保内部文件句柄关闭时，     打一个例外（如磁盘全额） ，而冲厕删除，在     indexwriter的mergesegments ，也就是在     indexwriter.addindexes 。 （迈克mccandless ）   6 。 Lucene的- 825 ：如果目录中删除后，      fsdirectory.getdirectory （ ） ，但在此之前indexreader.open你现在得到     1 filenotfoundexception像Lucene的预2.1 （在此之前，整你    得到的NPE ） 。 （迈克mccandless ）   7 。 Lucene的- 800 ：除去反斜线从term_char清单中的queryparser ，     因为反斜线是逃避性格。也改变了escaped_char     这份名单包含所有可能的字符，因为每个字符    如下反斜线应被视为逃脱。 （迈克尔布希公司）   8 。 Lucene的- 372 ： queryparser.parse （ ）现在确保整个输入字符串    被消耗。现在parseexception是投掷如果一个查询包含太多    闭幕括号。 （安德烈亚斯诺依曼途经迈克尔布希公司）   9 。 Lucene的- 814 ： javacc建设目标，现在定线端的作风，生成的文件。     现在还删去所有javacc生成的文件，然后javacc 。      （潘国加士，多伦科恩）      10 。 Lucene的- 829 ：关闭读者在contrib请/基准。 （卡尔wettin ，多伦科恩）  11 。 Lucene的- 828 ：轻微见效任期的平等（ ） 。      （保罗Cowan先生途经奥的斯gospodnetic ）  12 。 Lucene的- 846 ：固定：如果indexwriter是启用autocommit =虚假的，     和您致电addindexes ，并触及一个例外（如磁盘全额） ，然后    当indexwriter回滚事务，其内部状态，这可能舞弊    实例indexwriter （但不是指数本身）     参照已删除的部分。这种小虫是目前唯一的    在2.2 （主干） ，即是永远不会释放。 （迈克mccandless ）      13 。 Lucene的- 736 ：马虎短语查询与重复计算，火柴错误文档。     例如查询"土著联昌银行的" 〜 2匹配文件" abcde " 。 （多伦科恩）      14 。 Lucene的- 789 ：固定：自相似性是忽视了使用时multisearcher （问题报道    由阿列克谢龙） 。现在相似适用multisearcer.setsimilarity （ SIM卡）被使用。     注意，由于在此之前修复，创造一个multisearcher从搜索者为谁习俗相似    是一套没有任何影响-这是蒙面由相似的m ultisearcher。这是因为    设计的，因为multisearcher和经营searchables （不查册） 。 （多伦科恩）  15 。 Lucene的- 880 ：固定documentwriter关闭tokenstreams后    最近写了帖子。那么，资源与     tokenstreams可以安全获得释放。 （迈克尔布希公司）  16 。 Lucene的- 883 ：连续通话spellchecker.indexdictionary （ ）     不会插入条款两次了。 （丹尼尔纳贝尔）  17 。 Lucene的- 881 ： queryparser.escape （ ） ，现在也能逃出字     ' | '和' ＆ ' ，其中有部分的queryparser语法。 （迈克尔布希公司）  18 。 Lucene的- 886 ： spellchecker清理：例外的是没有印到stderr     再与忽视，但重新抛出异常。一些与JavaDoc改善。      （丹尼尔纳贝尔）  19 。 Lucene的- 698 ： filteredquery现在需查询刺激到帐户    得分。 （迈克尔布希公司）  20 。 Lucene的- 763 ： spellchecker ： lucenedictionary用来跳过首字    枚举。 （基督教马尔维茨途经丹尼尔纳贝尔）      21 。 Lucene的- 903 ： filteredquery解释，不准确的，与正面的影响。     解释测试，目前"深层次"的检查交代详情。      （克里斯hostetter ，多伦科恩）      22 。 Lucene的- 912 ： disjunctionmaxscorer第一skipto （目标）呼叫漠视    跳过指标参数，并结束了，在第一场比赛。      （ sudaakeran乙途经克里斯hostetter ＆多伦科恩）      23 。 Lucene的- 913 ：连续两次评分（ ）的调用会返回不同    分数为布尔疑问。 （迈克尔布希公司，多伦科恩）  24 。 Lucene的- 1013年：定位indexwriter.setmaxmergedocs工作"出的    盒" ，让我们再通过移动设置/ getmaxmergedocs从     logdocmergepolicy到logmergepolicy 。这个补丁空气污染指数    破损（非向后兼容的变化）所造成的Lucene的- 994 。      （ yonik斯利透过麦克mccandless ） 新功能  1 。 Lucene的- 759 ：新增两个N克生产tokenfilters 。      （奥的斯gospodnetic ）   2 。 Lucene的- 822 ：补充fieldselector能力，以供检索与利用     remotesearcher ，以及其他可检索的实现。 （马克米勒，给予英格索兰）   3 。 Lucene的0755 ：补充能够存储任意的二进制数据，在张贴的名单。     这些数据是所谓的有效载荷。为每个岗位有一个象征性的一个有效载荷的形式    一个可变长度的字节数组可以被保存在prox档案。     备注：宣传短片介绍了此功能是在实验状态，因此            载有适当的警告中的Javadoc 。      （迈克尔布希公司）   4 。 Lucene的- 834 ：补充boostingtermquery这可以增加分数的基础上，     价值观的一个有效载荷（见第3段） （金英格索兰）   5 。 Lucene的- 834 ：相似又有了新的方法，打分的有效载荷称为     scorepayloads可以凌驾充分利用有效载荷    存储（见＃ 3段）   6 。 Lucene的- 834 ：补充ispayloadavailable （ ）上termpositions接口和    实施它，在适当的地方（金英格索兰）   7 。 Lucene的- 853 ：补充remotecachingwrapperfilter使缓存的过滤器    按遥控器上侧的RMI的连接。      （马特埃里克森途经奥的斯gospodnetic ）   8 。 Lucene的- 446 ：补充solr的search.function数十基于现场    价值观，加上customscorequery简单的分数（张贴）定制。      （ yonik斯利，多伦科恩）   9 。 Lucene的- 1058年：增加了新的teetokenfilter （如Unix的'三通'命令） ，并sinktokenizer可以用来分享令牌两个或两个以上    等领域，即其他领域不须经过整个分析过程中需要再次改革。举例来说，如果你有两    领域，共享所有相同的分析步骤，除了一个小写令牌和其他没有，你可以协调行动    两者之间用teetokenfilter和sinktokenizer 。见teesinktokentest.java为例子。      （赠款英格索兰，迈克尔布希公司， yonik斯利）  优化  1 。 Lucene的- 761 ： proxstream现在克隆懒惰在segmenttermpositions     当nextposition （ ）的要求还是第一次。这使得利用实例    对segmenttermpositions不是segmenttermdocs没有额外的费用。      （迈克尔布希公司）   2 。 Lucene的- 431 ： raminputstream和ramoutputstream延长indexinput和     indexoutput直接。这样做可以避免进一步缓冲，从而避免了    不必要的阵列拷贝。 （迈克尔布希公司）   3 。 Lucene的- 730 ：更新booleanscorer2要利用booleanscorer在一些    案件，并可能提高得分的表现。文件，现在都可以    发表地地道道的阶，因为他们的成绩（如hitcollector ） 。      n.b.有点代码不得不禁用queryutils为了     testboolean2测试，以保持及格。      （保罗elschot途经奥的斯gospodnetic ）   4 。 Lucene的- 882 ： spellchecker并不储存ngrams了，但唯一指标    他们保持阐明指数小。 （丹尼尔纳贝尔）   5 。 Lucene的- 430 ：推迟分配缓冲区后，克隆bufferedindexinput 。     连同Lucene的- 888 ，这将使调整缓冲区大小    动态。 （保罗elschot ，迈克尔布希公司）    6 。 Lucene的- 888 ：增加缓冲大小内compoundfilewriter和     bufferedindexoutput 。还增加缓冲区大小，在     bufferedindexinput ，但只有当使用在合并。两者合计，     这些增加产量的10-18 ％ ，整体表现增益随    以前的千只拖欠款项。 （迈克mccandless ）   7 。 Lucene的- 866 ：增加多层次跳过名单张贴名单。这将显着加快    大部分的查询使用skipto （ ） ，尤其是对大指标与大张贴    清单。平均与质疑的加速是20 ％左右，为的查询功能    含有十分频繁和非常独特的条件，加速可以超过80 ％ 。      （迈克尔布希公司） 文件  1 。 Lucene的791 ＆ ＆红外线第1173 ：基础设施提出了wiki中，以     http://wiki.apache.org/lucene-java/更新了链接，在文档和    哪里，否则我发现参考资料。 （赠款英格索兰，乔Schaefer表示）   2 。 Lucene的- 807 ：固定的Javadoc scoredoccomparator.compare （ ） ，将    一致java.util.comparator.compare （ ） ：任何整数允许    归还而不只是-1/0/1 。      （保罗Cowan先生途经迈克尔布希公司）    3 。 Lucene的- 875 ：解决的Javadoc警告＆失误下jdk1.4 。     解决的Javadoc失误下jdk5 （罐在道路gdata ） 。     取得了"的Javadoc "目标依赖于"建设-c ontrib请"首下载     contrib请罐配置的动态下载。 （注：当运行    在防火墙后面，防火墙可能迅速流行起来） （多伦科恩）   4 。 Lucene的- 740 ：补充雪球-l icense.txt向滚雪球一样封装并进行了    这句话对许可notice.txt 。 （潘国加士途经迈克尔布希公司）   5 。 Lucene的- 925 ：补充分析软件包的Javadoc 。 （赠款英格索兰和多伦科恩）   6 。 Lucene的- 926 ：补充文件包的Javadoc 。 （赠款英格索兰） 建设  1 。 Lucene的- 802 ：补充license.txt和notice.txt以Lucene的罐子。      （潘国加士途经迈克尔布希公司）   2 。 Lucene的- 885 ： "蚂蚁测试" ，现在包括了所有contrib请测试。新     "蚂蚁测试核心"的目标，可以用来只运行的核心（非    还有contrib ）的考验。      （克里斯hostetter ）       3 。 Lucene的- 900 ： "蚂蚁测试" ，现在可以断言爪哇（在Lucene的包） 。      （多伦科恩）   4 。 Lucene的- 894 ：添加定制建立档案，为二进制分发，其中包括    目标，以建立演示。 （克里斯hostetter ，迈克尔布希公司）   5 。 Lucene的- 904 ： "一揽子"的目标，在build.xml ，现在也产生。外形尺寸：     校验和文件。 （克里斯hostetter ，迈克尔布希公司）   6 。 Lucene的- 907 ：包括license.txt和notice.txt在梅塔-干扰素的dirs     演示战争中，演示罐子，以及contrib请罐。 （迈克尔布希公司）       7 。 Lucene的- 909 ：演示目标运行演示。 （多伦科恩）   8 。 Lucene的- 908 ：提高内容的manifest文件，使定制    对于贡献。加入雪球-l icense.txt以梅塔-干扰素的雪球    瓦罐，并保证该lucli瓦罐载license.txt和notice.txt 。      （克里斯hostetter ，迈克尔布希公司）   9 。 Lucene的- 930 ：各种contrib请建设的改善，以确保contrib请    相依，都可以实现，并测试汇编误差不合格的建设。      （潘国加士，克里斯hostetter ）  10 。 Lucene的622 ：放入蚂蚁的目标和pom.xml档案，为建设行家文物    该Lucene的核心和contrib请单元。      （萨米祀仁，卡尔wettin ，迈克尔布希公司）  =======================释放2.1.0 2007-02-14 ================== ===== 变化在运行时的行为  1 。的' S '和' t '的已经从名单中剔除的默认停止字    在stopanalyzer （也用在由standardanalyzer ） 。拥有如的' S '     作为一个stopword意味着' S级，导致相同的结果，作为'阶级' 。     注意，这个问题仍然存在，为『 A 』 ，例如：在' A级'      ' '仍然是一个stopword 。      （丹尼尔纳贝尔）   2 。 Lucene的478 ：更新名单的Unicode代码点不等，为展示CJK型快     （现分为终审法院首席法官和K ）在standardanalyzer 。 （王约翰和    潘国罗经奥的斯电梯gospodnetic ）   3 。修改部分展示CJK型快的Unicode代码点不等，在standardtokenizer.jj ，     增加了几颗多的人，以增加展示CJK型快字的报道。     还记载了部分的范围。      （奥的斯gospodnetic ）   4 。 Lucene的- 489 ：添加支持领先的通配符字符（ * ， ？ ）      queryparser 。默认是不允许他们像以前。      （潘国加士途经奥的斯gospodnetic ）   5 。 Lucene的- 703 ： queryparser改为默认使用的constantscorerangequery     为范围查询。补充useoldrangequery财产queryparser允许    选择旧rangequery级，如果需要。      （马克哈伍德）   6 。 Lucene的- 543 ： wildcardquery现在执行termquery如果提供的任期    不包含通配符字符（ ？或* ） ，当以前     stringindexoutofboundsexception被抛出。      （迈克尔布希公司经埃里克出雏机）   7 。 Lucene的- 726 ：除去利用废弃doc.fields （ ）方法和    枚举。      （迈克尔布希公司经奥的斯电梯gospodnetic ）   8 。 Lucene的- 436 ：除去敲定（ ） terminfosreader和segmentreader ，     并新增一个电话enumerators.remove （ ） terminfosreader.close （ ） 。     该敲定（ ）压倒加入，以帮助前1.4.2 JVM的错误    这已被固定，再加上我们不再支持预1.4.2 jvms 。      （奥的斯gospodnetic ）   9 。 Lucene的- 771 ：默认位置的写锁现    索引目录，并命名为简单的" write.lock " （无大    消化前缀） 。系统属性" org.apache.lucene.lockdir "     也不是" java.io.tmpdir "早已不再是用来作为全球目录    存放锁定档案，并lock_dir领域fsdirectory是    现在已经过时了。 （迈克mccandless ） 新功能  1 。 Lucene的- 503 ：新thaianalyzer和thaiwordfilter在contrib请/分析仪     （ samphan raruenrom途经克里斯hostetter ）   2 。 Lucene的- 545 ：新fieldselector API及相关变更     indexreader和实现。新fieldable接口，用于    与懒惰场装载机制。 （赠款英格索兰和Chuck     威廉斯途经金英格索兰）   3 。 Lucene的- 676 ：移至solr的prefixfilter以Lucene的核心。 （由良    斯莫尔斯基， yonik斯利）   4 。 Lucene的- 678 ：补充nativefslockfactory ，实行锁    使用OS本地锁（经java.nio .* ） 。 （迈克尔mccandless经     yonik斯利）   5 。 Lucene的- 544 ：补充能力，指定不同的提升，能因应    不同的领域时，用multifieldqueryparser （马特埃里克森    途经奥的斯gospodnetic ）   6 。 Lucene的- 528 ：新indexwriter.addindexesnooptimize （ ） ，这并不    优化指数何时加入新的细分，只有表演    合并或按需要发放。 （李宁途经yonik斯利）   7 。 Lucene的- 573 ： queryparser现在允许反斜线逃逸    引用的名词术语。 （迈克尔布希公司经yonik斯利）   8 。 Lucene的- 716 ： queryparser现在允许规格的Unicode     人物条款通过的Unicode逃生的形式/ uxxxx      （迈克尔布希公司经yonik斯利）   9 。 Lucene的- 709 ：补充ramdirectory.sizeinbytes （ ） ， indexwriter.ramsizeinbytes （ ）     和indexwriter.flushramsegments （ ） ，可以使应用    控制的记忆体数量用来缓冲文件。      （夹头威廉姆斯途经yonik斯利）  10 。 Lucene的- 723 ： queryparser现在解析： * * matchalldocsquery      （ yonik斯利）  11 。 Lucene的- 741 ：命令行实用程序修改或删除规范    对各个领域，在现有的指数。这主要是基于Lucene的- 496     住在contrib请/杂项。      （克里斯hostetter ，奥的斯gospodnetic ）  12 。 Lucene的- 759 ：补充ngramtokenizer和edgengramtokenizer阶级和    他们通过单元测试。      （奥的斯gospodnetic ）  13 。 Lucene的- 565 ：补充方法indexwriter能够更高效    处理更新文件（ "删除，然后加上"用例） 。这    是打算以最终取代现行     indexmodifier 。补充indexwriter.flush （ ） （改名为从     flushramsegments （ ） ） ，以冲洗所有悬而未决的更新（在内存） ，以    该名录。 （李宁透过麦克mccandless ）  14 。 Lucene的- 762 ：补充说，在规模和size_and_break fieldselectorresult选项    它允许一个检索的大小就像一场未经检索    实际领域。 （夹头威廉姆斯途经金英格索兰）  15 。 Lucene的- 799 ：妥善处理懒惰，压缩领域的合作。      （迈克klaas途经金英格索兰） 空气污染指数的变化  1 。 Lucene的- 438 ：消除"最后的"从道理，落实cloneable ，请允许    变化termtext途经settermtext （ ） 。 （ yonik斯利）   2 。 org.apache.lucene.analysis.nl.wordlistloader已被废弃    和原本应该是取代与wordlistloader班    包org.apache.lucene.analysis （丹尼尔纳贝尔）   3 。 Lucene的- 609 ：回复返回型的document.getfield （们） ，场    为向后兼容，增加了新的document.getfieldable （ ）     为获得新的懒加载领域的合作。 （ yonik斯利）   4 。 Lucene的- 608 ： document.fields （ ）已被废弃和新方法     document.getfields （ ）已补充说，返回一个名单，而不是    枚举（丹尼尔纳贝尔）   5 。 Lucene的- 605 ：新explanation.ismatch （ ）方法和新complexexplanation     子类允许解释方法产生的解释模式     "匹配"独立的具有正面价值。      （克里斯hostetter ）   6 。 Lucene的- 621 ：新的静态方法indexwriter.setdefaultwritelocktimeout     和indexwriter.setdefaultcommitlocktimeout为压倒一切默认    超时值，为将来所有的事例indexwriter （以及    至于任何其他阶级的，可参考的静态价值，     即： indexreader ） 。      （迈克尔mccandless途经克里斯hostetter ）   7 。 Lucene的- 638 ： fsdirectory.list （ ） ，现在只返回该目录的     Lucene的相关文件。由于这一改变现在可以建构     1 ramdirectory从一个文件系统目录中包含文件    不涉及Lucene的。      （西蒙willnauer途经丹尼尔纳贝尔）   8 。 Lucene的- 635 ：解耦锁定的实施时间由目录    执行。补充设置/ getlockfactory至目录，并提出    所有锁码到子类抽象类lockfactory 。      fsdirectory和ramdirectory仍拖欠他们事先锁定    实现的，但现在你可以自由地混合与匹配，例如使用     singleinstancelockfactory （即，在内存锁定）锁定同一个     fsdirectory 。注意，现在你必须呼吁setdisablelocks前    该实例1 fsdirectory如果你想禁用锁    对于该目录中。      （迈克尔mccandless ，杰夫帕特森途经yonik斯利）   9 。 Lucene的- 657 ：取得fuzzyquery非最终与内scoreterm保障。      （潘国加士途经奥的斯gospodnetic ）  10 。 Lucene的- 701 ： lockless承诺：承诺锁已不再需要    当一个作家的命令，和一个读者打开了指数。这包括    改变指数文件格式（见文档/ fileformats.html为    详情） 。它也消除了所有API与承诺    锁及超时。读者现在真正唯读，不    第一座另一个启动。这是第一步，以获得     Lucene的工作，正确超过NFS的（第二个步骤是     Lucene的- 710 ） 。 （迈克mccandless ）  11 。 Lucene的- 722 ： default_min_doc_freq被拼错defalt_min_doc_freq     在相似的morelikethis阶层。该拼错已    取而代之的正确拼写。      （安迪vajda途经丹尼尔纳贝尔）  12 。 Lucene的- 738 ：缩小档案记录，其中    文件被删除时，有多少删除的文件    小。这改变了索引文件格式，并不能    阅读先前版本的Lucene的。 （多伦科恩途经yonik斯利）  13 。 Lucene的- 756 ：维持所有准则，在一个单一的。自然资源管理档案，以减少    许多公开的档案和文件内容概述非复合指数    格式。这改变了索引文件格式，但能够保持    阅读能力和更新旧的指标。第一部分合并    对旧格式指数将建立一个单一的。自然资源管理档案，为新    部分。 （多伦科恩途经yonik斯利）  14 。 Lucene的- 732 ： datetools支持已经被加入到queryparser ，     二传手都默认决议，并每场决议案。     为了向下兼容， datefield是仍在使用，如果没有决议    指明。 （迈克尔布希公司经克里斯hostetter ）  15 。补充isoptimized （ ）方法来indexreader 。      （奥的斯gospodnetic ）  16 。 Lucene的- 773 ： deprecate了fsdirectory.getdirectory （ * ）的方法    采取一个布尔"创造"的说法。反之，你应该使用     indexwriter的"创造"的论调，以创建一个新的指数。      （迈克mccandless ）  17 。 Lucene的- 780 ：添加一个静态directory.copy （ ）方法来复制文件    从一个目录到另一个地方。 （依库恩透过麦克mccandless ）  18 。 Lucene的- 773 ：补充directory.clearlock （串名称） ，有力地    拆除旧锁。默认的执行是要求     lockfactory （如果非空） ，以明确的锁定。 （迈克mccandless ）  19 。 Lucene的- 795 ： directory.renamefile （ ）已被废弃，因为它是    不要再使用内Lucene的。 （丹尼尔纳贝尔）  bug修复  1 。固定网络应用演示（内置与"蚂蚁战争演示" ）     没有工作，因为它用了一个queryparser方法了    被拆除（丹尼尔纳贝尔）   2 。 Lucene的- 583 ： isolatin1accentfilter未能保存positionincrement      （ yonik斯利）   3 。 Lucene的575 ： spellchecker敏分数，是不正确的改变，由suggestsimilar      （卡尔wettin途经yonik斯利）   4 。 Lucene的- 587 ： explanation.tohtml产生畸形的HTML      （克里斯hostetter ）   5 。修理，让matchalldocsquery可以使用remotesearcher （ yonik斯利）   6 。 Lucene的- 601 ： ramdirectory和ramfile作出串行化     （卡尔wettin途经奥的斯gospodnetic ）   7 。 Lucene的- 557 ：修补，以booleanquery和filteredquery使该评分    解释匹配了与实际分数。      （克里斯hostetter ）   8 。 Lucene的- 607 ： parallelreader的termenum未能预先妥善    新的领域（夹头威廉姆斯，基督教kohlschuetter途经yonik斯利）   9 。 Lucene的- 610 ， Lucene的- 611 ：简单的语法变化，使编制与欧洲法院：      disambiguate党内一流射手的使用DOC的（ ）在booleanscorer2 ，     其他测试代码的变化。 （马克史密斯途经yonik斯利）  10 。 Lucene的- 451 ：所有核心的查询类型，现在使用complexexplanations使    新增的零不要混淆booleanweight解释方法。      （克里斯hostetter ）  11 。 Lucene的- 593 ：固定lucenedictionary的党内迭代     （ kåre fiedler克里斯坦森途经奥的斯gospodnetic ）  12 。 Lucene的- 641 ：固定场外由一臭虫与indexwriter.setmaxfieldlength （ ）      （丹尼尔纳贝尔）  13 。 Lucene的- 659 ：珍爱perfieldanalyzerwrapper代表getpositionincrementgap （ ）     要正确分析仪，用于现场。 （夹头威廉姆斯途经yonik斯利）  14 。 Lucene的- 650 ：固定的NPE在当地的具体字符串排序时，文件    没有价值。      （奥利弗记途经克里斯hostetter ）  15 。 Lucene的- 683 ：固定数据贪污阅读时偷懒装领域。      （ yonik斯利）  16 。 Lucene的- 678 ：固定的臭虫在nativefslockfactory造成相同    锁，以分担不同的目录中。      （迈克尔mccandless途经yonik斯利）  17 。 Lucene的- 690 ：固定螺纹不安全使用indexinput由懒惰装领域。      （ yonik斯利）  18 。 Lucene的- 696 ：定位错误时，得分手为disjunctionmaxquery已skipto （ ）     要求它明年之前（ ） 。 （ yonik斯利）  19 。 Lucene的- 569 ：固定spannearquery臭虫，为' inorder疑问，它会败诉    承认下令跨度，如果他们重叠无序跨度。      （保罗elschot途经克里斯hostetter ）  20 。 Lucene的- 706 ：更新fileformats.xml |的HTML有关docdelta价值    在频文件。 （约翰stuyts ，多伦科恩途经金英格索兰）  21 。 Lucene的- 715 ：固定私营构造indexwriter.java至    妥善释放后天写锁，如果存在一个     ioexception后获得写锁，但在此之前整理    实例化。 （马太博戈西安途经麦克mccandless ）  22 。 Lucene的- 651 ：多线程的不同要求，同时     fieldcache入境（通常为整理，一个外地）在同    时间造成多代指入境，这是    不利的性能和内存使用。      （奥利弗记途经奥的斯gospodnetic ）  23 。 Lucene的- 717 ：固定build.xml不是要失败的时候，有没有库迪尔。      （多伦科恩途经奥的斯gospodnetic ）  24 。 Lucene的- 728 ：除去重复/旧morelikethis和similarityqueries     上课时间还有contrib /相似性，因为他们的新家园，是根据    还有contrib /疑问。      （奥的斯gospodnetic ）  25 。 Lucene的- 669 ：不要双关在randomaccessfile      fsindexinput /输出期间敲定（ ） 。除了派     ioexception了向总理事会，这也可能是导致这种间歇     "处理的是无效的" ioexceptions Windows的时候，试图    接近读者或作家。 （迈克尔布希公司透过麦克mccandless ）  26 。 Lucene的- 702 ：定位indexwriter.addindexes （ * ） ，不贪指数    对任何例外（如磁盘全额） 。语义，这些方法    现在交易性质：要么，各项指标均合并或无。     此外，固定indexwriter.mergesegments （称为外     addindexes （ * ） adddocument ，优化， flushramsegments ）      indexreader.commit （ ） （称为亲密） ，以清理和保持    比如国家一致的，以什么的，其实在指数（迈克     mccandless ） 。  27 。 Lucene的- 129 ：改变定稿做"尝试{...}最后     （ super.finalize ();}" ，以确保我们千万不要错过，在定稿    班以上。 （ esmond彼特透过麦克mccandless ）  28 。 Lucene的- 754 ：定位问题，介绍了Lucene的- 651 ，造成     indexreaders以流连永远的，除了不    操纵原fieldcache性能问题。      （克里斯hostetter ， yonik斯利）  29 。 Lucene的- 140 ：定indexreader.deletedocument （ int起点docnum ）     正确提高arrayindexoutofboundsexception当docnum太    大。以前，如果docnum只稍微过大（     同样多的八，即高达7 ints超越maxdoc ） ，没有    例外会提高，相反，该指数将成为    静静地败坏了。腐败，那么结果只会出现晚得多，     在mergesegments ，当腐化部分，是并入    部分（ ）之后。 （迈克mccandless ）  30 。 Lucene的- 768 ：修复的情况下，破例在deletedocument ，      undeleteall或setnorm在indexreader可以离开读者在    状态接近（ ）不释放写锁。      （迈克mccandless ）  31 。罢免"入境许可证" ，从已知的索引文件的扩展，因为它是    从来没有使用过。 （尼可拉斯lalevée途经贝瀚梅塞尔）      32 。 Lucene的- 767 ：如何改变segmentreader.maxdoc （ ）的计算方法是不    依靠文件长度检查，而是使用segmentinfo的     doccount ，这种情况已经明确地存放在索引中。这是一个    防守漏洞修复（即，不存在已知的问题，可见"实质    人生" ，由于这只是一个可能的未来问题） 。 （夹头    威廉姆斯透过麦克mccandless ） 优化   1 。 Lucene的- 586 ： termdocs.skipto （ ） ，现在更有效率     多段指标。此举将改善业绩的许多     各类疑问，对一个非优化指标。 （黄宏发哈德森     经yonik斯利）    2 。 Lucene的- 623 ： ramdirectory.close现在nulls其参考，以各     内部的"档案" ，让他们可获gced即使提到了      ramdirectory本身仍然存在。 （ nadav har'el途经克里斯hostetter ）    3 。 Lucene的- 629 ：压缩领域不再是无压缩和      recompressed期间部分合并（例如，在索引或     优化） ，从而提高性能。 （迈克尔布希公司途经奥的斯      gospodnetic ）    4 。 Lucene的- 388 ：提高索引性能时，是maxbuffereddocs      大型经常保持计数的缓冲文件，而不是     计数后，每一份文件，除了。 （多伦科恩，保罗史密斯      yonik斯利）    5 。改性termscorer.explain使用termdocs.skipto （ ） ，而不是     缝盘通过文档。 （赠款英格索兰）    6 。 Lucene的- 672 ：新的索引部分合并政策冲所有     缓冲文件，以他们自己的部分和拖延合并，直到      mergefactor环节一定水平得到积累。      这都增加了索引的表现在场删除     文档或部分满阶层以及使未来     优化。      注：本也修正了一个"根据合并"的错误，它是     可能得到的太多环节在你的指数（这将     大幅放缓搜索，风险用尽文件描述符     限制等） 。这是可以发生的时候，有多少缓冲的文档     接近，再加上若干文档，在过去的非内存部分，是     大于mergefactor 。 （李宁， yonik斯利）    7 。懒惰装领域不必要保留一个额外的副本装     字符串数据。 （ yonik斯利）    8 。 Lucene的- 443 ： conjunctionscorer的性能提升。加快     任何booleanquery一个以上的强制性条款。       （阿卜杜勒乔德里，保罗elschot途经yonik斯利）    9 。 Lucene的- 365 ： disjunctionsumscorer业绩增长      〜 30 ％ 。加快疑问与任择条款。 （保罗elschot经      yonik斯利）   10 。 Lucene的- 695 ：优化bufferedindexinput.readbytes （ ） ，中型     大小缓冲器，这将加快合并和检索二进制     和压缩领域的合作。 （ nadav har'el途经yonik斯利）   11 。 Lucene的- 687 ：懒惰的跳跃就接近档案速度最     疑问涉及任期的职位，包括短语查询。       （迈克尔布希公司经yonik斯利）   12 。 Lucene的- 714 ：更换2案件手册闭环阵列复制     与通话system.arraycopy相反，在documentwriter.java 。       （尼可拉斯lalevee透过麦克mccandless ）   13 。 Lucene的- 729 ：非递归skipto和明年实施      termdocs为multireader 。旧的，可以执行      recurse最多有多少环节在指数。 （ yonik斯利）   14 。 Lucene的- 739 ：提高部分合并表演重用     规范阵列横跨不同领域做散装写道：      规范的环节，没有删除文档。      （迈克尔布希公司经yonik斯利）   15 。 Lucene的- 745 ：添加booleanquery.clauses （ ） ，允许直接进入     该份名单中的条款，并取代内部同步向量     同一个同步的名单。 （ yonik斯利）   16 。 Lucene的- 750 ：移除定稿，由fsindexoutput及动议      fsindexinput finalizer以实际文件，使所有的无性系不     注册新的finalizer 。 （ yonik斯利） 测试案例   1 。补充testtermscorer.java （金英格索兰）    2 。补充testwindowsmmap.java （班森margulies透过麦克mccandless ）    3 。 Lucene的- 744个附列user.name财产上临时目录     这就是创造，因此不会干扰其他用户。 （赠款英格索兰） 文件   1 。补充样式表，以xdocs命名lucene.css并包括在      anakia vsl描述。 （赠款英格索兰）    2 。补充scoring.xml文件到xdocs 。更新similarity.java      得分公式（赠款英格索兰和史蒂夫罗维。更新：      迈克尔mccandless ，多伦科恩，克里斯hostetter ，道格切割） 。      问题664 。    3 。补充的Javadoc fieldselectorresult.java 。 （赠款英格索兰）    4 。提出xdocs目录，以钢骨混凝土/网站/ src目录/文件/内容/ xdocs ％      问题707个。网站现在还建立了用福里斯特，就像其他Lucene的     兄弟姐妹。见http://wiki.apache.org/jakarta-lucene/howtoupdatethewebsite      上的信息更新网站。 （英格索兰给予的帮助下，由史蒂夫罗维，      克里斯hostetter ，道格切割，奥的斯gospodnetic ， yonik斯利）    5 。补充说，在开发商和系统要求路段下的资源（金英格索兰）    6 。 Lucene的- 713更新任期向量组的档案格式，包括     文件就如何抵消和位置信息储存在tvf档案。       （赠款英格索兰，萨米尔abdou ）    7 。补充，在连接到三叶草测试代码覆盖报告下发展     科资源（金英格索兰）    8 。 Lucene的- 748 ：补充细节语义indexwriter.close对     打一个例外。 （微型轿车市场史维理途经麦克mccandless ）    9 。补充了一些文本什么是载于新闻稿。       （李家祥haszlakiewicz途经金英格索兰）    10 。 Lucene的- 758 ：定位与JavaDoc澄清ramdirectory （目录）       使得完整版的起始目录。 （迈克mccandless ）    11 。 Lucene的- 764 ：定位的Javadoc细节临时空间需求      为indexwriter的优化（ ） ， addindexes （ * ）和adddocument (...)       方法。 （迈克mccandless ） 建设   1 。补充说，在三叶草测试代码覆盖率百分之http://issues.apache.org/jira/browse/lucene-721      使三叶草代码覆盖，你一定有clover.jar在蚂蚁      classpath下，并指定- drun.clover =真正的命令行。       （迈克尔布希公司，并给予英格索兰）    2 。增加了一个sysproperty在共同build.xml每Lucene的752至地图java.io.tmpdir至      $ （ build.dir ） /测试就像tempdir sysproperty 。    3 。 Lucene的- 757增添了新的目标命名的init -的dist但这格局     分布既二进制和源分布情况。所谓包装     与包装- *-钢骨混凝土 =======================释放2.0.0 2006年5月26日================== ===== 空气污染指数的变化  1 。所有已废弃的方法和领域，已被调离，除了     datefield ，它仍然会得到支持，为一些时间    所以Lucene的，可以阅读其领域日期从旧指标     （ yonik斯利＆金英格索兰）   2 。 disjunctionsumscorer不再是公众。      （保罗elschot途经奥的斯gospodnetic ）   3 。创造一个领域都与一个空洞的名称和空值    现在抛出一个illegalargumentexception      （丹尼尔纳贝尔）   4 。 Lucene的- 301 ：增加了新的indexwriter （ （字符串，文件，目录）     分析器）施工人员表示，不采取一个布尔"创造"     论据。这些新的施工人员将创建一个新的指数，如果    必要的，否则，附加到现有的功能组别。 （丹armbrust经    麦克mccandless ） 新功能  1 。 Lucene的- 496 ：命令行工具，需要修改的规范场的一个    现有的指数;补充说：还有contrib /杂项。 （克里斯hostetter ）   2 。 Lucene的- 577 ： sweetspotsimilarity补充说：还有contrib /杂项。      （克里斯hostetter ）      bug修复  1 。 Lucene的330 ：解决问题的filteredquery没有工作，妥善以内     booleanquery 。 （保罗elschot途经埃里克出雏机）   2 。 Lucene的- 515 ：使constantscorerangequery和constantscorequery工作    与remotesearchable 。 （菲利普laflamme途经yonik斯利）   3 。补充方法，以取得/设置writelocktimeout和commitlocktimeout在     indexwriter 。这些可定在Lucene的1.4使用系统财产。     此功能已被拆掉，没有加入相应    吸气/ setter方法。 （丹尼尔纳贝尔）   4 。 Lucene的- 413 ：固定arrayindexoutofboundsexception例外    当使用spanqueries 。 （保罗elschot途经yonik斯利）   5 。实施filterindexreader.getversion （ ）和iscurrent （ ）      （ yonik斯利）   6 。 Lucene的- 540 ：固定一个bug与indexwriter.addindexes （目录[ ] ）     这有时会导致指数秩序的文件，以改变。      （ yonik斯利）   7 。 Lucene的- 526 ：固定的一个bug fieldsortedhitqueue造成    随后弦乐各种不同的locales排序相同。      （保罗Cowan先生途经yonik斯利）   8 。 Lucene的- 541 ：添加失踪extractterms （ ） disjunctionmaxquery      （斯特凡将途经yonik斯利）   9 。 Lucene的- 514 ：补充gettermarrays （ ）和extractterms （ ）      multiphrasequery （李家祥贾殷＆ yonik斯利）  10 。 Lucene的- 512 ：固定classcastexception在parallelreader.gettermfreqvectors      （福雷德克途经yonik ）  11 。 Lucene的- 352 ：固定的臭虫在spannotquery这表现为：      nullpointerexception时， "排除"的质疑并非spantermquery 。      （克里斯hostetter ）  12 。 Lucene的- 572 ：固定的臭虫在spannotquery hashcode ，无视排除条款     （克里斯hostetter ）  13 。 Lucene的- 561 ：固定部分parallelreader臭虫。 nullpointerexception如果读者    不知道外地的，但读者并不了解，如果有缺失，     和deletedocument通话可以绕过同步对subreaders 。      （夹头威廉姆斯途经yonik斯利）  14 。 Lucene的- 556 ：补充空extractterms （ ）执行，以matchalldocsquery和     constantscorequery为了让他们使用，以multisearcher 。      （ yonik斯利）  15 。 Lucene的- 546 ：除去2 GB的文件大小限制为ramdirectory 。      （彼得皇家， Michael Chan说， yonik斯利）  16 。 Lucene的- 485 ：不承诺锁，同时去过时指数    档案。 （吕克vanlerberghe经切割）  1.9.1  bug修复  1 。 Lucene的- 511 ：修复一个bug在bufferedindexoutput优化    介绍在190决赛。 （ shay banon ＆潘国tamm经切割）  1.9决赛注意，这个版本是多数，但不是百分之一百源兼容先前发布的Lucene的（ 1.4.3 ） 。在其他的话，你应该确保你的应用程序编制与此版本的Lucene的前你取代旧Lucene的罐子与新的。有许多方法都被废弃了预期的2.0版，所以控诉警告是意料之中的时候，记者杨彪报道：从1.4.3至1.9 。  bug修复   1 。修复了indexwriter.setmaxbuffereddocs （ 1 ）工作，有负    影响索引的性能，并因此得到回复。该    论据setmaxbuffereddocs （ int ）的，现在必须至少为2 ，否则    一个例外是抛出。 （丹尼尔纳贝尔）  优化       1 。优化bufferedindexoutput.writebytes （ ）的使用     system.arraycopy （ ） ，在更多情况下，而不是照搬字节按字节。      （卢卡斯zapletal经切割）  1.9 rc1 要求  1 。以编制和使用Lucene的，你现在需要的Java 1.4或更新版本。 变化在运行时的行为  1 。 fuzzyquery再也不能扔toomanyclauses例外。如果一个     fuzzyquery扩大至超过booleanquery.maxclausecount     条件只有booleanquery.maxclausecount最相似条款    进入改写了质疑，因此，例外的情况是可以避免的。      （克里斯多夫）   2 。改变系统特性，由" org.apache.lucene.lockdir "      " org.apache.lucene.lockdir " ，所以它的外壳沿用现行    模式用在其他Lucene的系统属性。 （贝瀚）   3 。条款rangequeries和fuzzyqueries现正转化为    小写默认（因为它已经如此prefixqueries     和wildcardqueries前） 。使用setlowercaseexpandedterms （假）     要禁用此行为，但注意，这也影响     prefixqueries和wildcardqueries 。 （丹尼尔纳贝尔）   4 。文件的次数太多，计算时multisearcher是用现    计算机正确， "在全球范围内"一刀切subsearchers和指数，而    之前，它曾经是计算机在本地各个指标，从而导致    排名跨多个指标不具有相同含义。      （夹头威廉姆斯，狼西伯斯基途经奥的斯，臭虫编号31841 ）   5 。开业时，一个indexwriter与创造=属实， Lucene的，现在只是删除    它自己的档案，从索引目录（看文件名的后缀    决定，如果一个文件属于Lucene的） 。在旧的行为被删除    所有的档案。 （丹尼尔纳贝尔和贝瀚梅塞尔，错误编号34695 ）   6 。该版本的indexreader ，经由getcurrentversion （ ）     和getversion （ ）并不开始于0了新的指标。相反，它    现在初始化，由系统时间在几毫秒。      （贝瀚梅塞尔途经丹尼尔纳贝尔）   7 。几个缺省值，可以不设通过系统性能看不下去，因为    有考虑过这个问题不宜在一个图书馆一样， Lucene的。为    大多数性能有设置/获取方法可在indexwriter其中    你应该使用。这将影响以下属性：     见indexwriter为吸气/ setter方法：        org.apache.lucene.writelocktimeout ， org.apache.lucene.commitlocktimeout ，        org.apache.lucene.minmergedocs ， org.apache.lucene.maxmergedocs ，        org.apache.lucene.maxfieldlength ， org.apache.lucene.termindexinterval ，        org.apache.lucene.mergefactor ，     见booleanquery为吸气/ setter方法：        org.apache.lucene.maxclausecount     见fsdirectory为吸气/ setter方法：        disablelucenelocks      （丹尼尔纳贝尔）   8 。固定fieldcacheimpl使用用户提供intparser和floatparser ，     与其用整数及浮动班解析。      （ yonik斯利途经奥的斯gospodnetic ）   9 。专家级搜索例程返回topdocs和topfielddocs     不再正常化分数。这也修复了臭虫相关     multisearchers和分数排序/正常化。      （吕克vanlerberghe途经yonik斯利， Lucene的- 469 ） 新功能  1 。增加的支持对于存储压缩领域（补丁编号31149 ）      （贝瀚梅塞尔途经克里斯多夫）   2 。增加的支持对于二进制存储领域（补丁编号29370 ）      （提请哈桑和贝瀚梅塞尔途经克里斯多夫）   3 。补充支持的立场，并抵消了信息在任期载体     （补丁编号18927 ） 。 （赠款英格索兰＆克里斯多夫）   4 。一类新datetools已经被加入。它可以让你的日期格式    在一个可读的格式已经足够索引。不像现行     datefield级datetools能应付日期1970年之前，它    逼着你指明所期望的日期的决议（如一个月，一天，     第二， … … ） ，它可以使rangequerys对这些领域更有效率。      （丹尼尔纳贝尔）   5 。 queryparser现在正确工程与分析仪，可以返回更多    超过一个令牌每立场。例如，查询" +快速+汽车"     将被解析为" +快速+ （车汽车） ， "如果分析器    回报"汽车"和"汽车"上的立场是一致的时候    认定的"汽车" （补丁编号23307 ） 。      （ pierrick brihaye ，丹尼尔纳贝尔）   6 。证无缓冲目录中的实现（例如，使用mmap ） 。      inputstream是代之以新班indexinput和     bufferedindexinput 。 outputstream是代之以新班     indexoutput和bufferedindexoutput 。 inputstream和outputstream     现在已废弃，并fsdirectory现在subclassable 。 （切割）   7 。加上本土目录和termdocs建置工作    升阳。这些都需要海合会3.4.0或更新版本，只有经过测试    在Linux上。使用'蚂蚁升阳'建立演示应用。 （切割）   8 。放入mmapdirectory ，它使用氧化镍，以mmap输入档案。这是    还是有点慢fsdirectory 。不过，它使用较少    记忆每一个查询搜索，因为一个新的缓冲区，是不是分到每个    而言，可以帮助申请使用，如通配符    疑问。它也可能终有一天将更快。 （切割＆保罗elschot ）   9 。补充的Javadoc -内部build.xml -臭虫编号3 0360      （保罗elschot途经奥的斯）  10 。补充rangefilter ，更笼统地有用过滤比datefilter 。      （克里斯米hostetter途经埃里克）  11 。补充numbertools ，工具类索引数字领域的合作。      （改编自典贡献马特鹌鹑;致力于由Erik ）  12 。补充公共静态indexreader.main （串[ ]距翻译起始位）的方法。      indexreader现在可以用来直接在命令行水平    以名单，并有选择地提取个人档案，由现行    复合索引文件。      （改编自典贡献盖瑞特鲁尼;犯下的贝瀚）  13 。放入indexwriter.settermindexinterval （ ）方法。见的Javadoc 。      （道格切割）  14 。补充lucenepackage ，其静态get （ ）方法返回java.util.package ，     让来电者获得Lucene的版本信息，在指定    该Lucene的罐子。      （道格切割途经奥的斯）  15 。补充hits.iterator （ ）方法和相应的hititerator击中物体。     这项规定标准java.util.iterator迭代以上命中目标。     每次通话向迭代器的下一个（ ）方法返回一个打击对象。      （杰里rayner途经埃里克）  16 。放入parallelreader ， indexreader相结合的独立指标    以上不同领域成单一虚拟指数。 （道格切割）  17 。放入intparser和floatparser界面，以fieldcache ，使    场任意格式，可存储作为ints和彩车。      （道格切割）  18 。补充级org.apache.lucene.index.indexmodifier相结合     indexwriter和indexreader ，使您可以添加和删除文件，而不    担心同步/锁定事宜。      （丹尼尔纳贝尔）  19 。 Lucene的，现在可以用内未签名Applet的，因为Lucene的的访问    以系统性能不会令securityexception了。      （琼舒斯特途经丹尼尔纳贝尔，错误编号34359 ）  20 。增加了一个新的阶层matchalldocsquery相匹配的所有文件。      （王约翰途经丹尼尔纳贝尔，错误编号34946 ）  21 。补充能力，以省去规范，对每场的基础上，以减少    指数的大小和内存消耗的时候，是有很多方面的索引。     见field.setomitnorms （ ）      （ yonik斯利， Lucene的- 448 ）  22 。补充nullfragmenter还有contrib / highlighter ，这是有益的    突出整个文件或领域的合作。      （埃里克出雏机）  23 。补充正规表示疑问， regexquery和spanregexquery 。     注同一任期枚举变量适用于这些质疑    适用于wildcardquery和其他任期扩大疑问。     这两个新的疑问，目前不支持通过queryparser 。      （埃里克出雏机）  24 。补充constantscorequery其中包过滤器，并产生一个分数    等于质疑刺激每个匹配的文件。      （ yonik斯利， Lucene的- 383 ）  25 。补充constantscorerangequery生产不断分数为    每一份文件，在该范围内。有一个好处，超过正常rangequery     的是，它没有扩大到booleanquery ，因而并没有一个最高    若干条款的范围可以涵盖。这两个端点也可予以公开。      （ yonik斯利， Lucene的- 383 ）  26 。补充，还能够指定最少数目的任择条款    必须匹配在booleanquery 。见booleanquery.setminimumnumbershouldmatch （ ） 。      （保罗elschot ，克里斯hostetter途经yonik斯利， Lucene的- 395 ）  27 。补充disjunctionmaxquery规定的最高分数了自己的条款。     这是非常有益的探索跨越多个领域的合作。      （夹头威廉姆斯途经yonik斯利， Lucene的- 323 ）  28 。新一类isolatin1accentfilter取代口音汉字在ISO     拉丁语一字符集，由他们unaccented当量。      （斯文duzont途经埃里克出雏机）  29 。新一类keywordanalyzer 。 " tokenizes "整个流作为一个单一的道理。     这是非常有用的数据一样，邮递区号， ID和一些新产品的名字。      （埃里克出雏机）  30 。复制lengthfilter从contrib请区核心。删除的话太    长太短，从流。      （大卫斯宾塞途经奥的斯和丹尼尔）  31 。补充getpositionincrementgap （字符串字段） ，以分析仪。这使得    定制分析仪把差距场实例与同一领域    姓名，以防止短语或跨度疑问跨越这些界限。该    默认实施问题的一项空白， 0 ，让默认令牌    位置增量1至把下一个字段的第一令牌成    接二连三的立场。      （埃里克出雏，意见yonik ）  32 。 stopfilter现在可以忽略的情况时，检查站的话。      （赠款英格索兰途经yonik ， Lucene的- 248 ）  33 。放入topdoccollector和topfielddoccollector 。这些简化    实施击中收藏家收集只    得分最高的或自上而下的排序命中目标。 空气污染指数的变化  1 。几个方法和领域已被废弃了。 API文档    包含有关建议的替代产品。这是计划    因为大部分的废弃方法和新领域，将被遣送离境     Lucene的2.0 。 （丹尼尔纳贝尔）   2 。俄罗斯和德国仪已经被转移到contrib请/分析器。     此外， wordlistloader阶级已被移动一个层次，在    等级制度，并正org.apache.lucene.analysis.wordlistloader      （丹尼尔纳贝尔）   3 。空气污染指数包含的方法，声称要抛出一个ioexception     但从未尝试过。这些声明被拆除。如果    你的代码试图赶上这些例外情况，你可能需要移除    那些赶上条文，以避免编译错误。 （丹尼尔纳贝尔）   4 。添加Serializable的参数级规范参数的ENUM     班booleanclause和外地。 （克里斯多夫）   5 。补充重写方法，以所有spanquery子筑巢其他spanquerys 。     这使得定制spanquery亚表示，重写（任期扩张，为    举例来说） ，巢内的内置式spanquery班成功。  bug修复  1 。 JSP的演示页面（钢骨混凝土/ JSP中/ results.jsp ） ，现在适当关闭     indexsearcher它揭开了。 （丹尼尔纳贝尔）   2 。固定的一个bug indexwriter.addindexes （ indexreader [ ]读者）     阻止删除一些过时的部分。 （克里斯多夫goller ）   3 。 FIX在fieldinfos以避免返回额外的空白领域     indexreader.getfieldnames （ ） （补丁编号19058 ） 。 （马克哈伍德途经贝瀚）   4 。一些组合booleanquery和multiphrasequery （原     phraseprefixquery ）可能挑起unsupportedoperationexception      （错误编号33161 ） 。 （ rhett sutphin途经丹尼尔纳贝尔）   5 。小bug skipto的conjunctionscorer造成nullpointerexception     如果skipto （ ）被称为没有事先致电到明年（ ）固定的。 （克里斯多夫）   6 。禁用similiarty.coord （ ） ，在得分的大部分自动    布尔产生疑问。该coord （ ）评分的因素是    适当的时候，条文是独立指定一个用户，     但通常是不恰当的时候，第产生    自动，例如，由一个模糊，通配符或远程查询。火柴    这种自动产生疑问不再受罚    不匹配的所有条款。 （道格切割，补丁编号33472 ）   7 。获得锁定文件与lock.obtain （长期） ，本来是要等待    某一金额毫秒，而这却是行不通的。      （王约翰途经丹尼尔纳贝尔，错误编号33799 ）   8 。修理fsdirectory.createoutput （ ） ，始终创造新的档案。     以前，现有的档案被覆写，以及一个指数可    败坏的时候，旧版本的一个文件，时间较新。     现在，任何现有的档案是第一次拆除。 （道格切割）   9 。修理booleanquery含有嵌套spantermquery的，而此前    可以返回一个不正确点击次数。      （ reece威尔顿途经埃里克出雏，错误编号35157 ）  10 。修理nullpointerexception可能发生的一个multiphrasequery     内booleanquery 。      （汉斯耶尔姆和斯科蒂李鹏飞途经丹尼尔纳贝尔，错误编号35626 ）  11 。固定snowballfilter可以穿越位置由增量    原来道理。      （ yonik经斯利埃里克出雏， Lucene的- 437 ）  12 。补充Unicode的各种韩文字体，以standardtokenizer ，     分组毗连字符成为一个象征，而不是只有一个道理    每字。这种变化也改变了心意型向" <cj> "     对于中文和日文字符令牌（以前这是" <cjk> " ） 。      （ cheolgoo康途经奥的斯和埃里克， Lucene的- 444和Lucene的- 461 ）  13 。 fieldsreader现在看来，在fieldinfo.storeoffsetwithtermvector和     fieldinfo.storepositionwithtermvector ，并创造了场    正确termvector参数。      （弗兰克斯氏经伯恩哈德Lucene的- 455 ）  14 。固定wildcardquery要防止"猫"配对"的核证机关？ ？ " 。      （消马经伯恩哈德Lucene的- 306 ）  15 。固定的一个bug那里multisearcher和parallelmultisearcher可    改变排序时，排序由字符串文件    价值为排序领域。      （吕克vanlerberghe途经yonik ， Lucene的- 453 ）  16 。固定一个排序问题multisearchers可导致    遗失或重复文档由于平等文档整理，在一个任意命令。      （ yonik斯利， Lucene的- 456 ）  17 。一命中利用专家级分类检索方法    导致在分数不正常化。      （ yonik斯利， Lucene的- 462 ）  18 。固定低效记忆体使用时加载一个指标纳入ramdirectory 。      （弗拉基米尔bychkoviak途经伯恩哈德Lucene的- 475 ）  19 。更正任期冲抵经由chinesetokenizer 。      （光曾途经埃里克出雏， Lucene的- 324 ）  20 。固定multireader.undeleteall （ ） ，以正确地更新numdocs 。      （罗伯特kirchgessner途经道格切割， Lucene的- 479 ）  21 。竞赛条件indexreader.getcurrentversion （ ）和iscurrent （ ）     固定收购承诺锁定。      （吕克vanlerberghe途经yonik斯利， Lucene的- 481 ）  22 。 indexwriter.setmaxbuffereddocs （ 1 ）不具备预期效果时，     但这个问题已被固定。 （丹尼尔纳贝尔）  23 。固定queryparser当所谓的同一个日期，在当地形成像     " 2000年1月16日至2000年1月18日] " 。这个疑问并不包括文件    对2000年1月18日，即最后一天，是不包括在内。 （丹尼尔纳贝尔）  24 。拆除清理限制义无返顾一个例外，如果有    还没有任何价值，为排序字段（ yonik斯利， Lucene的- 374 ） 优化       1 。磁盘使用（峰值要求在索引和优化）     在案件复合文件格式已得到改善。      （伯恩哈德德米特里，并克里斯多夫）   2 。优化性能的某些用途的booleanscorer ，      termscorer和indexsearcher 。特别是， booleanquery     组成termquery ，并非所有的条款规定，即返回一个     topdocs （例如，通过访问，没有指定排序）违背得多    速度更快。 （切割）       3 。拆除同步，从读任期向量与     indexreader （补丁编号30736 ） 。 （贝瀚梅塞尔途经克里斯多夫）   4 。优化一词字典查找拨出少得多的条件时，     扫描匹配。这将显着加快，涉及搜查    低频而言，如果成本字典查找，可    显着。 （切割）   5 。优化模糊查询，使标准模糊查询同一个前缀     0目前运行的20-50 ％的速度（补丁编号31882 ） 。      （乔纳森hager途经丹尼尔纳贝尔）       6 。一种版本的booleanscorer （ booleanscorer2 ）补充说，提供    文件中增加秩序，并实施skipto 。为疑问    符合要求或禁止的条文，它可能快过旧     booleanscorer ， booleanqueries只可选    条文，它可能是比较慢。新booleanscorer现    默认。 （补丁31785保罗elschot途经克里斯多夫）   7 。使用uncached进入规范的时候，合并，以减少记忆体的使用情况。      （错误编号32847 ） 。 （道格切割）   8 。不看长远的指数时，随机存取不需要。这    缩短时间，以公开indexreaders ，他们使用更少的内存时，     随机存取不要求，例如，当合并环节。该    中期指数是现在读入内存懒惰在第一次    随机存取。 （道格切割）   9 。优化indexwriter.addindexes （目录[ ] ）的时候，有多少    补充指标大于mergefactor 。以前这可能    结果在二次性能。现在的表现是n日志（ n ）的。      （道格切割）  10 。加快建立termenum为指标与多元    部分和删除文件，从而加快prefixquery ，      rangequery ， wildcardquery ， fuzzyquery ， rangefilter ， datefilter ，     和分拣第一时间对现场。      （ yonik斯利， Lucene的- 454 ）  11 。优化和广义32位浮点运算，以字节     （定制8位浮点运算）的转换。上升速度     similarity.encodenorm （ ）的任何地方，从10 ％至250 ％ ，这取决于Java虚拟机。      （ yonik斯利， Lucene的- 467 ） 基础设施  1 。 Lucene的源代码文件已经转换，从cvs来    颠覆罪。新的存放处，是在     http://svn.apache.org/repos/asf/lucene/java/trunk   2 。 Lucene的的问题跟踪迁移从Bugzilla程序，以几种。      Lucene的的几种是在http://issues.apache.org/jira/browse/lucene     老问题仍在于     http://issues.apache.org/bugzilla/show_bug.cgi?id=xxxx      （使用错误序号不是为xxxx ）  1.4.3   1 。 JSP的演示页面（钢骨混凝土/ JSP中/ results.jsp ）现在妥善越狱误差    邮件可能含有用户输入（例如错误讯息约    查询解析） 。如果你使用该网页，以此为出发点贵    自己的代码请确保你的代码，还妥善越狱的HTML     汉字由用户输入，以避免使所谓的交叉网站    脚本攻击。 （丹尼尔纳贝尔）      2 。 queryparser变化1.4.2打破queryparser空气污染指数。现在老     空气污染指数是支持。 （克里斯多夫）  1.4.2   1 。固定的臭虫编号31241 ：排序可能导致不正确结果（文件    失踪，其他人重复） ，如果排序键并非独一无二，并有    共100多场比赛。 （丹尼尔纳贝尔）   2 。内存泄漏在分类代码（错误编号31240 ）淘汰。      （ rafal krzewski途经克里斯多夫和Daniel ）       3 。 fuzzyquery现在需额外参数指明    最低相似，即要求一个任期，以配合查询。     该queryparser语法，因为这是长远的〜十，其中x是一个浮动    点数> = 0 < 1 （更大数量意味着更高    相似性是需要） 。再者，是一个前缀，可以指定    为fuzzyquerys所以只有那些条款被认为是类似的表示，     从这一前缀。这可以加快fuzzyquery很大。      （丹尼尔纳贝尔，克里斯多夫goller ）       4 。 phrasequery和phraseprefixquery现在容许明确规范    相对的立场。 （克里斯多夫goller ）       5 。 queryparser变化：见效arrayindexoutofboundsexceptions      （补丁＃ 9110 ） ，有的闲置方法参数拆除;能力    订定最低相似fuzzyquery已经被加入。      （克里斯多夫goller ）   6 。 indexsearcher优化：一个新的scoredoc不再分配    对于每一个非0的得分击中。这使得'或'查询功能    包含共同条件大大加快。 （切割）  1.4.1   1 。固定表演臭虫在击中分类代码，如果价值观不    正确缓存。 （ aviran经切割）   2 。固定的错误文件格式的文件。 （丹尼尔纳贝尔）  1.4决赛  1 。补充说： "是一个"在该份名单中的停止词在stopanalyzer ，以补充    现行的" A " 。修理了臭虫28960       （ http://issues.apache.org/bugzilla/show_bug.cgi?id=28960 ） 。 （奥的斯）   2 。增加了新的阶级fieldcache管理，在记忆暗藏的领域任期    价值观。 （蒂姆琼斯）   3 。补充超载getfieldquery方法queryparser其中    接受模糊因子指定为词组（或默认    一语坡为queryparser举例） 。这使得压倒一切    方法，以取代phrasequery与spannearquery ，反而    保持适当的模糊因子。 （埃里克出雏机）   4 。改变了编码的germananalyzer.java和germanstemmer.java至     UTF - 8和改变了建立编码至UTF - 8 ，使修改过的文件    汇编。 （奥的斯gospodnetic ）   5 。拆除同步，从长远查找下indexreader方法     termfreq （ ） ， termdocs （ ）或termpositions （ ） ，以改善    多线程性能。 （切割）   6 。确定一个错误：过时的部分档案被删除，并没有在Win32 。  1.4 rc3   1 。修正了几个搜索臭虫介绍所skipto （ ）的变化    发布1.4rc1 。索引文件格式被改变一点，因此    藏品必须重新索引去利用这些skipto （ ）     优化。 （克里斯多夫goller ）   2 。增添了新文件的方法， removefield （ ）和removefields （ ） 。      （克里斯多夫goller ）   3 。固定不一致指数闭幕。索引和目录    现在只是关闭自动Lucene的时候， Lucene的开放    他们自动的。 （克里斯多夫goller ）   4 。增加了新的班级： filteredquery 。 （蒂姆琼斯）   5 。增加了一个新的sortfield型，以定制比较。 （蒂姆琼斯）   6 。锁获得定时出讯息，现在显示全路径，以锁定    档案。 （丹尼尔经纳贝尔埃里克）   7 。固定的一个bug spannearquery当命令道。 （保罗elschot经切割）   8 。固定，使fsdirectory的一把锁，仍然有工作的时候     java.io.tmpdir系统财产是无效的。 （切割）   9 。改变filteredtermenum的constructor采取任何参数，     作为参数不被理会，反正（臭虫编号28858 ）  1.4 RC2的  1 。 germananalyzer现在抛出一个例外，如果stopword档案    无法找到（错误编号27987 ） 。它现在已改用lowercasefilter      （错误编号18410 ） （丹尼尔纳贝尔途经奥的斯，埃里克）   2 。修补了几个错误，在文件格式的文件。 （切割）  1.4 rc1   1 。改变格式的。指令文件，使：      -它有一个格式的版本号码，这使得它更容易      后备兼容改变文件格式，在未来。      -任期指望的是，现在存储作为一项长期的。这是一个方面      该Lucene的的档案格式，这就限制了指数的大小。      -少数内部指标参数，现保存在索引中，使      他们可以（在理论上） ，现在改由指数编制索引，       虽然现时尚未有一个API这样做。     这些变化都是回兼容的。新的代码可以阅读岁    指标。但旧守则将无法读取新的指标。 （切割）   2 。补充，优化执行termdocs.skipto （ ） 。斗    表现保存每个学期中。 frq文件。这只能    增加了百分之或者两综合指数大小，但可大幅    加速许多搜查。 （切割）   3 。改组了分手API和所有分手的实施，采取    利用一个优化的termdocs.skipto （ ）的实施。在    特别是， phrasequerys和结膜booleanquerys是    快时，其中一个条款已大大减少比赛比    等。 （一结膜booleanquery是booleanquery所有    条文规定） （切割）   4 。增加了新的阶级parallelmultisearcher 。结合     remotesearchable这使得它很容易实现分布式    搜索系统。 （让-弗朗索瓦阿勒经切割）   5 。增加的支持对于击中分拣。结果，可现在加以整理，任何    索引领域。细节见的Javadoc     探索者＃搜索（查询，排序） 。 （蒂姆琼斯经切割）   6 。改变fsdirectory自动创建一个充满目录树，它    需要用mkdirs （ ） ，而不是mkdir （ ） 。 （姆拉登特克途经奥的斯）   7 。增加了一个新的跨度为基础的查询API 。这个执行，除其他    事情，嵌套短语。见的Javadoc细节。 （道格切割）   8 。增加了新的方法query.getsimilarity （探索者） ，并改变    分手来使用它。此证一亚纲质疑，使工人阶级    它可以指定自己相似的实施，或许    一说，代表们认为，通过的试练。 （朱利安尼奥什    经切割）   9 。补充multireader ， indexreader即融合了多种其他     indexreaders 。 （切割）  10 。增加的支持对于任期载体。见场＃ istermvectorstored （ ） 。      （赠款英格索兰，切割和德米特里）  11 。固定老臭虫与逃逸的特殊字符质疑    弦乐： http://issues.apache.org/bugzilla/show_bug.cgi?id=24665      （让-弗朗索瓦阿勒途经奥的斯）  12 。补充支持，为压倒一切的默认值以下，     使用系统属性：        -默认犯下锁超时       -默认m axfieldlength        -默认m axmergedocs        -默认m ergefactor        -默认m inmergedocs        -默认写锁超时     （奥的斯）  13 。改变queryparser.jj让' -'和' + '内部令牌：      http://issues.apache.org/bugzilla/show_bug.cgi?id=27491      （桑沃尔特途经奥的斯）  14 。改变，使复合指数格式是默认使用。     这使得索引要慢一些，但大大降低了机会    档案处理问题。 （切割）  1.3决赛  1 。补充渔获booleanquery元toomanyclauses在queryparser至    扔parseexception代替。 （埃里克出雏机）   2 。定nullpointerexception在query.explain （ ） 。 （道格切割）   3 。增加了新的方法indexreader.setnorm （ ） ，允许一    改变刺激的领域后，指数就诞生了。   4 。区分最后职务高低，党龄长短，当索引1     场。长度，是目前被定义为总人数的筹码，     而不是最后的位置，因为它是以前。长度    用于评分正常化（ similarity.lengthnorm （ ） ） ，并为    控制记忆体使用量（ indexwriter.maxfieldlength ） 。在这两个    这些案件中，共有多少筹码是比较好的选择使用    超过最后象征性的立场。立场是，在用字    寻（见phrasequery和token.setpositionincrement （ ） ） 。   5 。修理standardtokenizer的处理展示CJK型快字（中文，     日语和韩语汉字组成） 。此前连续序列    被合并成一个单一的逻辑，这是不是非常有用。现在    每个字生成一个单独的道理，这是更为有益。  1.3 rc3   1 。补充minmergedocs在indexwriter 。这可以提高速度    引而不改变档案数目，但只能使用更    记忆体。 （朱利安尼奥什途经奥的斯）   2 。修正错误编号24786 ，查询重写。 （ bschneeman经切割）   3 。修正错误编号16952 ，在演示HTML解析器，跳过评论     JavaScript的。 （克里斯多夫goller ）   4 。修正错误编号19253 ，在演示HTML解析器，地址空白，因为需要    输出（丹尼尔纳贝尔途经克里斯多夫goller ）   5 。修正错误编号24301 ，在演示HTML解析器，长标题不再    坑的东西。 （克里斯多夫goller ）   6 。修正错误编号23534 ，取代使用的文件时戳的部分档案    同一个指数，版本号码储存在部分档案。这    解决问题时，运行于文件系统的低分辨    时间戳，如居所资助计划下，在MacOS十（克里斯多夫goller ）   7 。修理queryparser使tokenmgrerror不扔，只有     parseexception 。 （埃里克出雏机）   8 。修理一些臭虫推出改变11 RC2的。 （克里斯多夫goller ）   9 。固定的一个问题汇编testrussianstem 。 （克里斯多夫goller ）  10 。清理了一些建设的鬼话。 （埃里克出雏机）  1.3 RC2的  1 。补充getfieldnames （布尔） indexreader ， segmentreader ，      segmentsreader 。 （朱利安尼奥什途经奥的斯）   2 。改变文件锁把锁在档案     system.getproperty （ " java.io.tmpdir " ） ，让所有用户    允许写入文件。这样，人们可以公开和正确    锁定指标是唯读给他们。   3 。 indexwriter ：增加了一项新的方法， adddocument （文件，分析器）     允许一个轻松使用不同的分析工具，为不同    文件在同一指数。   4 。轻微增强fuzzytermenum 。      （克里斯多夫goller途经奥的斯）   5 。 priorityqueue ：增加插入（对象）的方法和调整indexsearcher     和multiindexsearcher使用它。      （克里斯多夫goller途经奥的斯）   6 。固定的一个bug indexwriter ，归侨侨眷不正确doccount （ ） 。      （克里斯多夫goller途经奥的斯）   7 。固定segmentsreader消除混乱和略有不同    行为termenum在处理与枚举的所有条款，     银两枚举出发，从一个特定的任期。     这个补丁还修复了不正确任期文件时，频率相同，任期    目前在多个环节。      （克里斯多夫goller途经奥的斯）   8 。补充cachingwrapperfilter和perfieldanalyzerwrapper 。 （埃里克出雏机）   9 。补充支持，为新的"复合型档案"指数格式（德米特里    谢列布连尼科夫）  10 。补充，现场设置以queryparser ，使用日期范围解析。  11 。改变indexreader以便有需要时可子，由班    外面的包装物。此前，它已包公私    摘要方法。还修改了该指数合并守则，以便使它    可以工作，就武断地indexreader实施，并新增一个    新的方法， indexwriter.addindexes （ indexreader [ ] ） ，以接替    利用这一点。 （切割）  12 。增加了一个数量限制条款可能被加入到     booleanquery 。默认的上限是1024个条文。这应    停止大部分outofmemoryexceptions由前缀，通配符和模糊    疑问违背了肆意横行。 （切割）  13 。添加新的方法： indexreader.undeleteall （ ） 。这一切undeletes     删除文件仍留在指数。 （切割）  1.3 rc1   1 。固定priorityqueue的明确（ ）方法。     修理臭虫9454年， http://nagoya.apache.org/bugzilla/show_bug.cgi?id=9454      （ matthijs博霍夫途经奥的斯）   2 。改变standardtokenizer.jj文法电子邮件令牌。     修理臭虫9015年， http://nagoya.apache.org/bugzilla/show_bug.cgi?id=9015      （戴方安生途经奥的斯）   3 。补充能力要禁用锁创作用disablelucenelocks     系统特性。这是有益的，为唯读媒介，例如唯读光碟。      （奥的斯）   4 。补充身份证法访问，以能够获得该指数全球身份证。     所需的排序选项。      （卡尔森）   5 。补充支持，为新的远程查询语法，以queryparser.jj 。      （ briangoetz ）   6 。补充能力检索HTML文件' meta标签价值观     htmlparser.jj 。      （马克哈伍德途经奥的斯）   7 。改性queryparser ，以使人们有可能以编程明    默认布尔算子（或或和） 。      （ péter halácsy途经奥的斯）   8 。提出了许多搜索方法及班级非决赛中，每请求。     这包括indexwriter和indexsearcher ，等等。      （切割）   9 。补充级remotesearchable ，提供支援边远    寻找途经RMI的。测试级remotesearchabletest.java     提供了一个例子，说明这都可以使用。 （切割）   10 。补充phraseprefixquery （和支持multipletermpositions ） 。该     测试级testphraseprefixquery提供使用示例。       （安德斯尼尔森途经奥的斯）   11 。改变了德国产生的算法忽略的情况，而     剥离。新算法的速度和产生更平等     源于名词和动词源于同一个词。       （ gschwarz ）   12 。补充支持，为提高评分的文件，并经领域     这种新方法document.setboost （浮）和field.setboost （浮） 。      注：这改变了编码的一个索引值。指标     应该重新从零开始去创造，为使搜索分数     正确的。与新的代码和一个旧指数，将搜查     产量非常大的分数更短的领域，并非常小的分数     作较长时间的领域。一旦该指数是重新创建，分数会     一如以往。 （切割）   13 。增加了新的方法token.setpositionincrement （ ） 。      此证为目的，短语搜索，配售     多重条件在一个单一的位置。这是有益的同      stemmers产生多种可能源于一个字。      这还允许引进之间的差距计算，使     术语是在毗邻的一份心意流将不会配合     精确短语查询。这使得它有可能，例如，要建设     分析器那里句子不匹配超过停止词，其中     已被剔除。      最后，重复一份心意与增量为零也可以     用来提高分数的比赛就这一道理。 （切割）   14 。增加了新的过滤级， queryfilter 。这制约着搜索     结果只匹配那些还匹配提供查询。      结果缓存，使搜查后，先于同     指数使用这种过滤器是非常快的。      这可以用来，例如，一个rangequery对格式化     日期栏实施日期过滤。人们可以重新使用     单queryfilter相匹配，例如，只有文件的修改     在过去一周。该queryfilter和rangequery只会     需要加以改原本的每一天。 （切割）   15 。增加了一个新的indexwriter方法， getanalyzer （ ） 。这个返回     分析器使用时加入文件，以这个指数。 （切割）   16 。固定的一个bug与indexreader.lastmodified （ ） 。之前，文件     删除不更新这个地方。现在它需要。 （切割）   17 。补充说，俄罗斯分析器。       （鲍里斯奥克纳途经奥的斯）   18 。增加了公共性，可扩展得分空气污染指数。详情请参阅     的Javadoc org.apache.lucene.search.similarity 。   19 。固定回报的hits.id （ ）从浮点数诠释。 （特里steichen途经彼得） 。   20 。补充getfieldnames （ ） indexreader及分部（ ）阅读班。       （彼得mularien途经奥的斯）   21 。补充getfields （字符串）和getvalues （字符串）的方法。      贡献rasik潘迪于2002年10月9日      （ rasik潘迪途经奥的斯）   22 。经修订的内部搜索API 。转变包括：        答：疑问不再修饰在搜查。这使得       它可能的，例如，再用同样的问题，例如与       多指标，从多线程。        乙任期扩大疑问（如prefixquery ， wildcardquery ，        等等） ，现在的工作，正确与multisearcher ，定影臭虫12619        和12667 。        长刺激booleanquery的，现在工程，并得到了       单项查询（问题报道，由李mallabone ） 。因此质疑       如" （ +富+酒吧） ^ 2 + baz把"现正支持和相当于        " （ +富^ 2 +酒吧^ 2 ） + baz把" 。        四新的方法： query.rewrite （ indexreader ） 。这允许       查询重写本身作为候补，更原始些。        大部分的任期膨质疑班（ prefixquery ，         wildcardquery等） ，现正推行使用这种方法。        体育新的方法： searchable.explain （查询q ，诠释DOC ）的。这       返回一个解释，举例说明如何在特定       文件是对成绩查询。一个解释，可       表现为无论是纯文本，与tostring （ ）方法，或       为HTML格式，与tohtml （ ）方法。注意计算       解释是因为昂贵作为执行查询比       整个指数。这是打算用来开发       相似的实现，并为好的表现，应       不能够显示每击中。        楼射手和重量是公众，而不是一揽子保障。现在       可能有人写一分手，执行，即       而不是在org.apache.lucene.search封装。这仍是       较为先进的编程，我不期望任何人做       这在近期内，但至少现在这是可能的。         g.补充，市民存取器，以加强原始性质疑班        （ termquery ， phrasequery和booleanquery ） ，允许进入       他们的条件和条款。      注意：这是广泛的变化和它们尚未被     广泛的测试。错误报告是值得赞赏的。       （切割）   23 。更加方便ramdirectory建设者以文件和字符串     论据，为方便fsdirectory以ramdirectory转换。       （奥的斯）   24 。补充代码手册改名档案fsdirectory ，因为它     有报道说， java.io.file奇摩renameto （档案）的方法，有时     未能于Windows jvms 。       （马特塔克途经奥的斯）   25 。 refactored queryparser ，以使人们更容易把它扩大。      补充，能够自动降低的情况下，通配符条款     该queryparser 。       （ tatu saloranta途经奥的斯）  1.2 rc6   1 。改变queryparser.jj有" ？ "是一个特殊的字    任由它被用来作为通配符任期。更新testwildcard     单元测试也。 （拉尔夫hettesheimer途经卡尔森）  1.2 rc5   1 。更名为build.properties以default.properties和更新    该build.txt文件描述如何凌驾于     default.property设置，而不必编辑该文件。这    把构建过程更接近于金龟子的建设进程。      （琼）   2 。补充multifieldqueryparser阶层。 （开尔文谭，途经奥的斯）   3 。最新的"动力"的链接。 （奥的斯）   4 。固定的指令设立javacc -错误编号7 017（奥的斯）   5 。补充投掷例外，如果fsdirectory能不能创造新的目录     -错误编号6 914（尤金g luzberg途经奥的斯）   6 。更新multisearcher ， multifieldparse ，常数， datefilter ，      lowercasetokenizer与JavaDoc （奥的斯）   7 。补充修正，以避免nullpointerexception在results.jsp      （马克海斯途经奥的斯）   8 。改变通配符搜索找到0个或多个字符而不是1或更多     （李mallobone ，途经奥的斯）   9 。固定误差抵消问题germanstemfilter -错误编号7 412      （罗德里戈雷耶斯，途经奥的斯）   10 。补充单元测试，为通配符搜索和datefilter （奥的斯）   11 。允许共存的索引和非索引领域具有相同名称      （切割/凯斯伯，途经奥的斯）   12 。加上逃生品格，以单项查询。       （ briangoetz ）   13 。应用补丁程序，以确保搜索使用datefilter      不要抛出一个例外时，没有火柴被发现。 （大卫笑脸，经     奥的斯）   14 。固定的臭虫在datefilter和wildcardquery单元测试。 （切割，奥的斯，卡尔森）  1.2的RC4   1 。更新缴款科的网站。     放入XML文件＃ 3执行文件科。     还增加了任期突出，以国际船务科。 （卡尔森）   2 。固定nullpointerexception为短语搜索含有    未与条款，引入1.2rc3 。 （切割）   3 。改变文件删除代码，以获得该指数写锁，     执法事实，即除了文件，并删除不能    演出兼任。 （切割）   4 。各种文件清理。 （奥的斯， acoliver ）   5 。最新的"动力"的链接。 （切割，琼）   6 。固定的一个bug在germanstemmer 。 （贝瀚梅塞尔，途经奥的斯）   7 。改变一词，并质疑实行Serializable的。 （ scottganyo ）   8 。固定将永远不会删除指标的补充与indexwriter.addindexes （ ） 。      （切割）   9 。升格为junit 3.7 。 （奥的斯）  1.2 rc3   1 。 indexwriter ：固定的一个错误的地方，加入一个优化指标，以一个    空指数都失败了。这是遇到使用addindexes复制     1 ramdirectory指数，以一个fsdirectory 。   2 。 ramdirectory ：固定一个bug那里raminputstream不能读    全国超过全国单个缓冲区的边界。   3 。修理单项查询，所以它接受质疑与Unicode字符。      （ briangoetz ）   4 。修理单项查询，使prefixquery是优先使用     wildcardquery当有唯一的一个星号于去年底的    任期。以前prefixquery将永远不再使用。   5 。修理试验，让它们汇编;修理蚂蚁文件，所以编译测试    妥善。补充测试案例分析仪和priorityqueue 。   6 。最新演示，补充起步文件。 （ acoliver ）   7 。补充说： '贡献'节网页及文件。 （卡尔森）   8 。拆除javacc从源分布，为版权的原因。     乡亲现在必须下载本分开metamata以    编译Lucene的。 （切割）   9 。大大改善了性能datefilter加入    能力重用termdocs物体。 （切割）  10 。补充indexreader方法：       公共静态布尔indexexists （弦乐目录） ;       公共静态布尔indexexists （档案目录） ;       公共静态布尔indexexists （ Directory目录） ;       公共静态布尔islocked （ Directory目录） ;       公共静态无效解锁（ Directory目录） ;      （切割，奥的斯）  11 。固定的臭虫在germananalyzer （ gschwarz ）  1.2 RC2的， 2001年10月19日：   -补充来源分布  -拆除破碎建立脚本和图书馆的分布  -s egmentsreader：固定潜力的竞赛条件  -f sdirectory：固定，使g etdirectory（第X XX号属实）正确   除去该目录的内容，甚至当目录   已被浏览本JVM的。   -r angequery：定位问题，而一个包容各种质疑会   包括就近的来说，该指数高于非existant    特定上来说。   -s egmenttermenum：定位n ullpointerexception在克隆（ ）方法。    当一词是无效的。   -的J DK1 .1兼容性修正：残疾人锁定档案的J DK1 .1，    因为它们依靠的一个特点，在补充的JDK 1.2 。  1.2 rc1 （第一阿帕奇释放） ， 2001年10月2日：    -包更名，由c om.lucene以o rg.apache.lucene    -牌照转由L GPL（以阿帕奇   -蚂蚁只兴建-没有更多的M a kefile中   -增加锁档案-现在已完全螺纹及过程安全   -此外，德国s temmer    -m ultisearcher现在支持低层次的A PI搜索   -补充r angequery，为长远的远程检索   -分析器可以选择t okenizer基于现场名称   -其它b ug修复。  1.01b （最后的SourceForge版本） ， 2001年7月2日  。几个bug修复  。新的查询分析器  。新的前缀查询（搜索"富* "匹配"食品" ）  1.0 ， 2000年10月4日此版本修正了几个严重的错误，也包括一些性能优化， stemmer ，和其他几个小增强功能。  0.04 2000年4月19日 Lucene的，现在包括语法基于tokenizer ， standardtokenizer 。 唯一tokenizer列入前发布（ lettertokenizer ） 确定条款构成的全是英文字母。该新tokenizer使用正规表达式的语法，以找出更多综合班的条件，包括号码，缩略语，电子邮件地址等。  standardtokenizer有两个目的：   1 。这是一个很大的改善，一般用途tokenizer使用    申请。     最简单的方法，为应用程序开始使用     standardtokenizer是利用standardanalyzer 。   2 。它提供了一个很好的例子，文法基于tokenization 。     如果申请有特殊tokenization要求，它可以    实施定制tokenizer用拷贝目录包含    新tokenizer进入应用并修改它    据此。  0.01 ， 2000年3月30日第一开放源代码发布。 代码已经重新组织成一个新的软件包和目录结构本新闻稿。它建立好，但还没有经过测试以后，由于重新组织。 http://www.qyxxpd.com