Solr.NET快速入门(九)【二进制文档上传】【完】
来源:互联网 发布:易语言模块转源码 编辑:程序博客网 时间:2024/05/18 03:46
二进制文档上传
SolrNet支持Solr“提取”功能(a.k.a. Solr“Cell”)从二进制文档格式(如Word,PDF等)索引数据。
这里有一个简单的示例,显示如何从PDF文件中提取文本,而无需对其进行索引:
ISolrOperations<Something> solr = ...using (var file = File.OpenRead(@"test.pdf")) { var response = solr.Extract(new ExtractParameters(file, "some_document_id") { ExtractOnly = true, ExtractFormat = ExtractFormat.Text, }); Console.WriteLine(response.Content);}
ExtractOnly = true告诉Solr只执行文本提取,但不索引上传的文档。 如果ExtractOnly = false,您可以使用Fields属性添加更多字段。 其他选项可以通过ExtractParameters类的属性设置。 通常建议为内容提供StreamType,因为自动检测可能会失败。
有关ExtractParameters中每个选项的更多详细信息,请参阅Solr wiki和Solr参考指南。
使用SolrNet的网站,产品和公司
- http://www.education.gov.uk
- http://www.fancydressoutfitters.co.uk
- http://jobhits.net
- http://jobhits.co.uk
- http://www.leasetransfer.com
- http://www.leasetrader.com
- http://www.bedriftsoket.no
- http://www.watchfinder.co.uk
- http://www.sub.su.se/
- EPiSolr
- CapitalIQ
- http://www.crocus.co.uk
- http://www.waitrosegarden.com
- nopAccelerate (by Xcellence-IT)
- Sitecore
- http://www.libris.no/
0 0
- Solr.NET快速入门(九)【二进制文档上传】【完】
- Solr.NET快速入门(一)
- Solr.NET快速入门(二)【查询】
- Solr.NET快速入门(三)【Faceting】
- 快速入门solr
- Solr快速入门(一)
- Solr.NET快速入门(三)【高亮显示】
- Solr.NET快速入门(四)【相似查询,拼写检查】
- Solr.NET快速入门(五)【聚合统计,分组查询】
- Solr.NET快速入门(六)【核心管理,Fluent API】
- Solr.NET快速入门(八)【多核多实例,映射验证】
- Solr入门之官方文档6.0阅读笔记系列(九) 第四部分 数据索引操作
- 【solr专题之一】Solr快速入门
- 【solr专题之一】Solr快速入门
- solr 4.1入门官方文档
- ADO.NET 快速入门(九):使用关系型数据
- Solr.NET快速入门(七)【覆盖默认映射器,NHibernate集成】
- dom4j快速入门文档
- 安卓集成腾讯bugly里的热更新
- 《Objective-C编程全解》 读书笔记 第十四章 块对象
- mysql乐观锁总结和实践
- flume之Http Source
- MATLAB图像处理第二节
- Solr.NET快速入门(九)【二进制文档上传】【完】
- scala—基础I
- LinkedBlockingQueue 浅析
- CCF CSP试题 201612-1中间数
- Docker 使用ubuntu容器时,安装包包错:invoke-rc.d: policy-rc.d denied execution of start
- CodeForces 614 B Gena's Code
- 数据压缩实验一 色彩空间转换
- Win10 VS2017下OpenCV3.2配置
- VC对话框如何添加WM-ERASEBKGND消息-OnEraseBkgnd函数