Nutch 遇见hits.getHits()出现java.lang.ArrayIndexOutOfBoundsException解决办法

来源:互联网 发布:淘宝销量下滑原因分析 编辑:程序博客网 时间:2024/06/15 20:47
setMaxHitsPerDup()java.lang.ArrayIndexOutOfBoundsException: 20org.apache.nutch.searcher.Hits.getHits(Hits.java:63)        ... 这个原因很可能是因为设置了setMaxHitsPerDup()的原因在nutch定义的变量是hitsPerSite;比如这样设置:query.getParams().setDedupField(“site");setMaxHitsPerDup(2);那么结果集中只显示2个相同站点的记录。解决办法是,在遇到hits.getTotal()>hits.getLength()的时候,设置query.getParams().setMaxHitsPerDup(0);hits = bean.search(query);
原创粉丝点击