【示例教程】LEADTOOLS中如何通过OCR识别获取每一行文本
来源:互联网 发布:淘宝客佣金5元怎么设置 编辑:程序博客网 时间:2024/06/08 00:02
LEADTOOLS可帮您开发出功能强大的文档图像应用程序。其主要功能包括综合图像注释,专业的黑白图像显示(例如灰度级和偏黑),以及专业的黑白图像处理。其它功能包括对黑白图像的性能和内存进行优化,文档图像清理(包括倒置文本,去边界,去打孔机和去线)以及使用LEADTOOLS Fast TWAIN和WIA进行扫描。
本篇文介绍如何通过OCR分别识别获取文档的每一行文本。有一种方法类似于我们的IOcrZoneCharacters.GetWords方法可检索文档的每一行。OCR引擎识别的每个字符都有一个位置。我们可以通过OcrCharacter 结构的position 属性访问这个位置。返回一个或多个OcrCharacterPosition 枚举成员:
下面写了一个简单的小例子,用OcrCharacterPosition 来分别识别出每一行的文字。
using (RasterCodecs codecs = new RasterCodecs()){ codecs.Options.RasterizeDocument.Load.XResolution = 300; codecs.Options.RasterizeDocument.Load.YResolution = 300; RasterImage image = codecs.Load(inputFile); using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Professional, false)) { ocrEngine.Startup(null, null, null, @"C:\LEADTOOLS 19\Bin\Common\OcrProfessionalRuntime64"); using (IOcrDocument document = ocrEngine.DocumentManager.CreateDocument()) { document.Pages.AddPage(image, null); document.Pages[0].Recognize(null); IOcrPageCharacters pageCharacters = document.Pages[0].GetRecognizedCharacters(); for (int i = 0; i < document.Pages[0].Zones.Count; i++) { IOcrZoneCharacters zoneCharacters = pageCharacters.FindZoneCharacters(i); if (zoneCharacters != null) { foreach (var ocrCharacter in zoneCharacters) { OcrCharacterPosition position; position = ocrCharacter.Position; if ((position & OcrCharacterPosition.EndOfLine) == OcrCharacterPosition.EndOfLine) { Console.Write(ocrCharacter.Code + "\n"); } else { Console.Write(ocrCharacter.Code); } } } } } }}
阅读全文
0 0
- 【示例教程】LEADTOOLS中如何通过OCR识别获取每一行文本
- LEADTOOLS WinRT OCR识别代码示例
- LEADTOOLS WinRT OCR识别代码示例
- 【示例教程】如何通过leadtools读取二维码中的中文
- 【示例教程】LEADTOOLS中如何载入DICOM文件并压缩
- LEADTOOLS .NET OCR示例:多线程OCR
- 如何使用OCR识别控件LEADTOOLS OCR增强Google Drive搜索
- 图像处理包LEADTOOLS v18示例:iOS OCR 和 Barcode识别
- 【示例教程】LEADTOOLS中如何使PACS服务器管理器支持H264
- 如何通过CDC输出多行文本
- LEADTOOLS使用教程:创建OCR引擎实例
- 【示例教程】使用Leadtools对身份证进行识别和表单模板创建
- 【示例教程】LEADTOOLS中如何用H.264压缩视频创建DICOM文件
- Leadtools .NET OCR用法
- Flex中如何创建复数行文本内容的List
- LEADTOOLS v18多平台条码识别(代码示例)
- LEADTOOLS入门教程:Leadtools .NET OCR用法
- LEADTOOLS使用教程:表单识别和处理流程概述
- ReentrantLock实现原理详解
- 发布web项目到linux服务器下
- 红粉NBA:那些在联盟中的跨国恋情
- C语言练习题(5)
- HDUOJ1421(DP)
- 【示例教程】LEADTOOLS中如何通过OCR识别获取每一行文本
- 2016China Final 二分 UVALive7900(D)
- java 打印
- oracle数据库使用时间作为查询条件时的写法
- Linex新手常用命令
- MySQL高可用在网易的最佳应用与实践
- 关于网站扫描到的几种漏洞及处理办法
- HDU
- StateMachine状态机初识