solrj 文件索引问题
来源:互联网 发布:淘宝买家问质量怎么样 编辑:程序博客网 时间:2024/05/22 06:52
先上代码
public class SolrTest { public static final String SOLR_URL="http://localhost:8080/solr/core"; private SolrServer solr=null; @Test public void getSolrTest() throws Exception{ String fileName = "D:\\projects\\solr\\home\\docs\\solr-word.pdf"; String solrId = "solr-word.pdf"; solr = new HttpSolrServer(SOLR_URL); ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract"); String contentType="application/pdf"; up.addFile(new File(fileName), contentType); up.setParam("literal.id", solrId); up.setParam("uprefix", "attr_"); up.setParam("fmap.content", "attr_content"); up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true); solr.request(up); QueryResponse rsp = solr.query(new SolrQuery("*:*")); System.out.println(rsp); }}
测试运行,随之问题来了。
BUG_1:
org.apache.solr.client.solrj.impl.HttpSolrServer$RemoteSolrException: java.lang.NoClassDefFoundError: org/apache/xml/serialize/BaseMarkupSerializer at org.apache.solr.client.solrj.impl.HttpSolrServer.executeMethod(HttpSolrServer.java:552) at org.apache.solr.client.solrj.impl.HttpSolrServer.request(HttpSolrServer.java:210) at org.apache.solr.client.solrj.impl.HttpSolrServer.request(HttpSolrServer.java:206)
问题:缺少解析xml格式文件的jar包
解决方案:下载解析jar包放入solr项目下的lib文件夹,下载地址http://xerces.apache.org/mirrors.cgi,将下载文件中的 xercesImpl.jar与xml-apis.jar放入lib文件夹。
BUG_2:
[doc=solr-word.pdf] missing required field: filePath
问题:schema.xml文件中多出无法解析的字段filePath
解决方法:删掉filePath的field字段即可
把两个错误搞定后,pdf与doc文件都可以被成功解析索引。
schema.xml和solrconfig.xml就不贴出来了,很容易找到可以参考的。
0 0
- solrj 文件索引问题
- Solrj创建doc/pdf/txt文件索引,高亮查询
- SolrJ提交索引
- solrj实现增量索引
- 使用SolrJ创建索引
- SolrJ 操作索引文档
- SolrJ 管理索引库
- 使用Solrj管理Solr索引
- 使用Solrj管理Solr索引
- solrj创建富文本索引
- solrj定时增量更新索引
- 使用SolrJ管理索引库
- 使用solrJ管理索引库
- 使用SolrJ管理索引库
- solrj实现基本的添加索引,查询
- 使用solrj操作solr索引库
- solr/solrj按id进行索引更新
- solrJ对索引的删除操作
- 软件测试
- 深入学习Tomcat----自己动手写服务器(附服务器源码)
- 群芳争春------编程语言百家争鸣
- 时钟动画制作
- POJ-----3268双向最短路
- solrj 文件索引问题
- plsql连接oracle查询出现中文乱码,windows系统字符集设置
- Android Continuous Integration with Jenkins
- LightOJ 1294
- win32 下查看端口占用并释放相应进程
- 1086: [SCOI2005]王室联邦 (树分块)
- 深入理解DIP、IoC、DI以及IoC容器
- Coreseek 介绍以及 windows版本安装
- hdu 5726 GCD (二分+ST表)★