Tesseract-OCR 从编译到集成

来源:互联网 发布:扬州知行广告公司 编辑:程序博客网 时间:2024/06/03 15:58

编译

- 在指定的文件夹使用`git clone https://github.com/tesseract-ocr/tesseract`(作用:下载 tesseract-ocr 源代码 环境:安装git)- 下载最新版本的 CPPAN 并添加环境变量, 执行以下两条命令 `cppan --build pvt.cppan.demo.google.tesseract.tesseract-master` ; `cppan --build pvt.cppan.demo.google.tesseract-master` (作用:Build the latest library and the training tools 注意:每一个命令执行后都有可能执行错误,没有关系,对每条命令执行多次,直到错误稳定下来,这里的错误主要是编码问题,可以之后解决)- 执行以下代码 `mkdir win64 && cd win64`; `cppan ..` ; `cmake .. -G "Visual Studio 14 2015 Win64"`- 最后用VS2015打开tessract.sln,首先生成CPPAN,排除问题(我所遇到的主要问题是无法找到头文件,分别是:fcaliastail.h && fcftaliastail.h)后;接下来生成全部文件,再次排除问题。- 错误主要有以下几种:back_inserter --> 添加头文件`#include<iterator>` ; 修改equationdetect.cpp文件编码格式为 utf-8 ; 注释掉无法识别的 Language

集成

原创粉丝点击