tesseract OCR库在vs2010中的调用

来源:互联网 发布:sw画图软件 编辑:程序博客网 时间:2024/04/30 22:47

首先下载tesseract-ocr-setup-3.02.02所需要的文件http://download.csdn.net/download/lishuang1224/10012700


一.安装软件和dll

1.安装tesseract-ocr-setup-3.02.02.exe ,我的安装路径为D:\Program Files (x86)\Tesseract-OCR。

2.解压tesseract-3.02.02-win32-lib-include-dirs.zip文件,将里面的lib和include文件夹复制到D:\Program Files (x86)\Tesseract-OCR目录下

3.将资源文件中的liblept168.dll,liblept168d.dll,libtesseract302d.dll复制到D:\Program Files (x86)\Tesseract-OCR\lib目录下。

4.将chi_sim.traineddata复制到D:\Program Files (x86)\Tesseract-OCR\tessdata。


二. 修改环境变量和配置环境

1.将系统PATH变量增加D:\Program Files (x86)\Tesseract-OCR\lib。

2.在vs2010工程配置属性下,在包含目录下增加D:\Program Files (x86)\Tesseract-OCR\include\tesseract,在库目录下增加D:\Program Files (x86)\Tesseract-OCR\lib

如下图:


三.测试

建立vs2010工程:

#include "baseapi.h"    #include "strngs.h" #include<iostream>using namespace std;#pragma comment(lib, "libtesseract302.lib")  int main()    {        const char * image = "1.png";          tesseract::TessBaseAPI  api;        api.Init(NULL, "eng", tesseract::OEM_DEFAULT);        api.SetVariable( "tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" );          STRING text_out;        if (!api.ProcessPages(image, NULL, 0, &text_out))        {            return 0;        }          printf(text_out.string());      system("pause");
    return 0;    }
测试结果:


原图:




原创粉丝点击