Tesseract-OCR 3.02命令行程序的使用

来源：互联网发布：淘宝童装海报素材编辑：程序博客网时间：2024/05/21 07:00

OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别，获取的过程。最近因为需要看了看OCR的相关知识，这里我看的是谷歌的Tesseract-OCR检测引擎。Tesseract：开源的OCR识别引擎，初期Tesseract引擎由HP实验室研发，后来贡献给了开源软件业，后经由Google进行改进，消除bug，优化，重新发布。当前版本为3.05.
　　想要使用这个开源引擎，就要先将其源码编译才行。这里给出源码地址：Tesseract。这里我们要说的是对于官方对VS2008平台给出的一个可编译的工程，其版本是3.02，同时官方还给出了一个可安装的命令行执行程序，其地址在tesseract-ocr-setup-3.02.02.exe。下载好是可以直接安装的，其安装界面如下。
　　
　　按装时候会有一个Tesseract development files 的选项，如果勾选的话，在安装时会自动下载相关的开发文件。但是，由于谷歌在天朝的情况，所以我这里是连接不上的，大家安的时候可以不选，如果有啥要用的到时在去官网那下载就好了。由于安装时程序已将路径加入环境变量：

　　所以大家在命令提示窗直接运行就好，在命令窗输入tesseract如果出现下面结果就说明安装正确：
　　
　　这其实就列出了Tesseract3.02的功能选项，出现这样的输出就说明程序安装正确，下面就试验一下最基本的字符识别功能，因为我这里没有下载其他的中文字库，所以就识别一下下图中的英文就好：
　　
　　图片我放在D盘。所以先把当前路径换到D盘：>D:就行然后如入识别指令，其格式是：
　　>tesseract imagemane outputname
imagemane是图片名字， outputname是输出文件名字，以.txt文件形式保存。比如，这里我们测试图片名字是test.png,然后命令为：tesseract test.png test 如下图:

这样就识别成功了，然后早D盘下会有一个test.txt，打开后就可以看到检测结果了：

这就是Tesseract-ocr 3.02命令行的基本使用过程。

　　虽然可以直接使用，但是版本太低，且没发让开发者去DIY，所以下次我会写一下怎么对最新源码进行编译，得到Tesseract的库文件。

0 0