全面理解Asprise OCR:图片/条形码识别利器

来源:互联网 发布:icmp 端口 编辑:程序博客网 时间:2024/04/29 04:47

全面理解Asprise OCR:图片/条形码识别利器

1. OCR简介

OCR(Optical Character Recognition)——是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。(摘自百度百科)

简言之,OCR是一种可以将图片格式信息转换为可编辑文本的技术,而Asprise OCR是一种内嵌高性能OCR引擎、支持快速开发图片识别系统的软件组件,允许开发者使用多种语言,如VB,VB.net,VC++,VC.net,C#,Java,Delphi等。

2. Asprise OCR的特性

-易用

-高准确率

-支持条形码识别

-高识别速度

-保持原文档格式

-支持多平台

3. Asprise OCR的安装与开发环境的配置

3.1 为便于在开发的系统中使用Asprise OCR的功能,毋庸置疑,第一步需要正确安装,安装步骤如下:

1)官网下载Asprise OCR SDK,http://asprise.com/product/ocr,可选择跟所用开发语言匹配的SDK。

2)解压SDK

3) 拷贝dll文件至%PATH% 路径,如Windows下,可拷贝至C:\Windows\System32

4)运行解压文件中的可执行文件9来验证安装是否成功

至此,安装完毕,过程相当简易。

3.2 配置开发环境

Asprise OCR支持多种开发语言,而各种开发语言的环境配置大同小异。由于本文采用CSharp语言,且无需为其提供额外的环境配置,故,在此不再赘述环境配置的过程,建议参考官网介绍。

4. Asprise OCR API

为完成各种OCR工作,需对Asprise OCR API做简要介绍。

[string] OCR([string]imagePath, [int] imageFileType)

注:精确图像文件路径及格式,该功能将以字符串形式返回图片内容,如果类型参数设置为-1,Asprise OCR将自动决定文件格式。Asprise

OCR支持的图片格式较广泛,如.bmp,.ico,.jpg,.jpeg,.png,.pic,.jng,.gif等多达30种图片格式。

 

[string] OCRpart([string]imagePath, [int] imageFileType, [int] startX, [int] startY, [int] width, [int]height)

注:图片的部分区域实施OCR任务,其中(startX, startY)对应图像的左上方区域,(width, height)对应区域的宽度和高度。

 

[string]OCRBarCodes([string] imagePath, [int] imageFileType)

注:识别图片中的条形码,当有多个条形码时,会以换行符分割

 

[string]OCRpartBarCodes([string] imagePath, [int] imageFileType, [int] startX, [int]startY, [int] width, [int] height)

注:识别图片中条形码的部分区域

 

5. 实例开发与验证

参考Asprise OCR官网提供的用户手册,采用Csharp语言编写简单图片及条形码识别工具,以验证Asprise OCR的工作情况,在代码中需引入Asprise OCR的dll,添加代码如下。



在百度图片下载并保存一段扫描文件,如下图所示。顺便透漏一下,此段文字据说摘自林觉民《与妻书》,估计是英文版的吧,反正偶是看不懂说的啥,haha。



将文件导入到小工具中,提示所用Asprise OCR版本为试用版,由于只是学习,点【否(N)】即可。



图片识别小工具输出结果如下,可以看出识别的准确度还是可以的。



6. 总结

至此,关于AspriseOCR的介绍已经介绍完毕,感兴趣的朋友可以去官网继续查找资料、学习,本人只是出于好奇,顺便粗浅的研究一下,抛砖引玉罢了。

另外,Asprise OCR不支持中文,对英文及验证码等图片的抗干扰能力尚且不足,例如文字扭曲,图片较多噪点会大大降低识别的准确度,这可能也是需要继续加强的地方吧。

1 0