tesseract OCR库在vs2010中的调用

来源:互联网 发布:linux流量监控工具 编辑:程序博客网 时间:2024/05/01 05:01

首先下载tesseract-3.02的资源包,http://download.csdn.net/download/lishuang1224/10012700里面包含安装的所有资源

一.安装软件和dll
1.下载tesseract-3.02.02.exe,并安装,我的安装路径为D:\Program Files (x86)\Tesseract-OCR

2.将第2个资源文件中的tesseract-3.02.02-win32-lib-include-dirs.zip文件解压,将里面的lib和include文件夹复制到D:\Program Files (x86)\Tesseract-OCR目录下

3.将上面资源中第3个文件夹中的liblept168.dll,liblept168d.dll,libtesseract302d.dll复制到Tesseract-OCR\lib目录下,并替换。

4.将第4个文件夹下的chi_sim.traineddata,复制到D:\Program Files (x86)\Tesseract-OCR\tessdata下。

二.修改环境变量和配置环境
1.在系统PATH变量中增加D:\Program Files (x86)\Tesseract-OCR\lib。

2.配置vs2010的工程属性
在包含目录下新增:D:\Program Files (x86)\Tesseract-OCR\include\tesseract
在库目录下新增: C:\Program Files\Tesseract-OCR\lib
如图:
这里写图片描述

三.测试
建立vs2010工程:

#include "baseapi.h"    #include "strngs.h" #include<iostream>using namespace std;#pragma comment(lib, "libtesseract302.lib") int main()    {        const char * image = "2.png";        tesseract::TessBaseAPI  api;        api.Init(NULL, "eng", tesseract::OEM_DEFAULT);        api.SetVariable( "tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" );        STRING text_out;        if (!api.ProcessPages(image, NULL, 0, &text_out))        {            return 0;        }        printf(text_out.string());      system("pause");    return 0;    }

程序结果如下:
这里写图片描述

原图:
这里写图片描述