如何使用OCR识别控件LEADTOOLS OCR增强Google Drive搜索
来源:互联网 发布:淘宝客导购网站源码 编辑:程序博客网 时间:2024/06/06 01:04
Google Drive是一项非常不错的云储存服务,通过这项服务,用户可以储存,组织和共享文档、照片和视频文件等,但是TIFF和其他光栅图像文件格式却很容易丢失。为了很好地解决文件丢失的问题,开发人员可以使用LEADTOOLS OCR SDK提取文本,然后将文本添加到每个项目的IndexableTextData。接下来,便可以类似方式在基于文本的文档,如DOC或者PDF文件中搜索光栅图像文件。
例如,我们上传了四个普通TIFF文件到Google Drive,每个文件分别命名为OCR1,OCR2,OCR3和OCR4,因此,仅具有基于文件名的搜索功能完全没有任何帮助。
用我们看来,这些图像就是文本,但是对于Google Drive而言,它却将这些图像看作光栅数据,并且在我们试图搜索扫描文档的内部时,无返回。
难道谷歌就没有办法搜索你的文档?幸运的是,Google Drive会一直挂起,并且在执行文本搜索时,使用每个文档中可自定义的“IndexableTextData” 元数据。在接下来的例子中,我们一起来看看如何在不修改原始图像的情况下,使用Google Drive查找基于文本内容的TIFF文档。
连接到Google Drive
启动Google Drive API来检索ClientID和ClientSecret。因为,当使用 Google Drive API上传和修改TIFF文档时,需要使用到这些属性。接下来,下载 Google Client Library到引用中。
在本示例中,我们将打开WebBrowser控件中的User Authorization Uri,使用户可以输入自己的用户名和密码。用户登录以后,我们可以从WebBrowser控件的标题中获取授权码,然后我们就可以搜索所有账户中的TIFF文件。
使用LEADTOOLS OCR
最后,使用LEADTOOLS OCR引擎来获取TIFF文件的文本信息。创建IOcrEngine和IOcrDocument后, RecognizeText函数将返回一串从页面中提取的文本字符串,然后更新Google Drive中的IndexableTextData元数据。
接下来,在Google Drive中搜索TIFF文档,结果显示如下:
此文应用原文出自:http://www.leadtools.com/downloads/InstantDownload.asp?download=/whitepapers/2013/using-leadtools-ocr-to-enhance-google-drive-search.pdf
- 如何使用OCR识别控件LEADTOOLS OCR增强Google Drive搜索
- LEADTOOLS PDF应用实例:增强Google Drive搜索功能
- LEADTOOLS WinRT OCR识别代码示例
- LEADTOOLS WinRT OCR识别代码示例
- 使用office2003 MODI控件做识别 OCR
- LEADTOOLS使用教程:创建OCR引擎实例
- 【示例教程】LEADTOOLS中如何通过OCR识别获取每一行文本
- 如何使用ocr文字识别软件
- Leadtools .NET OCR用法
- LEADTOOLS .NET OCR示例:多线程OCR
- LEADTOOLS入门教程:Leadtools .NET OCR用法
- LEADTOOLS OCR技术案例展示
- 使用 office2007 document imaging control 控件 做识别 OCR
- 使用 office2003 document imaging control 控件 做识别 OCR
- ocr识别
- ocr识别
- OCR识别
- ocr识别
- 关于Android堆内存的设置
- SPOJ 364 - Pocket Money(DP)
- 7zip抽取(extract)NSIS打包exe文件的小bug:一个名为eUseMenu.dll的会被错误抽取为$R0
- C#中的泛型
- Ant 标签说明 [转]
- 如何使用OCR识别控件LEADTOOLS OCR增强Google Drive搜索
- hdu 1085
- unity3D调用外接摄像头,并保持为图片
- 使用iOS手势UIGestureRecognizer
- Android中POST请求代码
- linux 内核移植 2.6.35.4 到s3c2440
- hdu(1533)Going Home(poj2195)
- UNIX常用命令详解及UNIX系统上的文本操作简介
- spring源码解读-加载解析配置文件