Tesseract3.05.01dev Windows10 安装记录

来源:互联网 发布:mac系统网游 编辑:程序博客网 时间:2024/06/05 07:44

1、下载exe文件:

http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.00dev.exe

2、下载需要的字库文件,注意对应的版本

https://github.com/tesseract-ocr/tesseract/wiki/Data-Files

3、安装下载好的exe文件,选择默认安装 C:\Program Files (x86)\Tesseract-OCR

4、把下载好的字库文件复制到C:\Program Files (x86)\Tesseract-OCR\tessdata 下

5、设置环境变量,非常重要

1)系统环境变量中,Path添加“ C:\Program Files (x86)\Tesseract-OCR ”

2)系统环境变量中,添加变量“ TESSDATA_PREFIX ”,变量值为“C:\Program Files (x86)\Tesseract-OCR\tessdata ”,如下图

       

6、系统重启,或者在打开终端(cmd 或 PoerShell)的情况下,重启终端。

7、打开cmd,输入:tesseract -v, 结果如下图


8、命令

tesseract  [xxx.jpg]  [result.txt | stdout]   [-l eng | chi_sim]

9、其他

1)在PowerShell 和 cmd 运行命令有些不同,因为PowerShell对命令要求拼写更严格一些;

2)如果要输出到文件result.txt中,需要以管理员身份运行cmd,否则不会生成result.txt文件;

3)最后指定字库的时候,只要字库的前缀,例如eng.traineddata ,只输入并且只能输入eng

10、至此,可以在任意盘下,任意目录下使用tesseract。