在linux下安装tesseract-ocr
来源:互联网 发布:双十一淘宝成交额 编辑:程序博客网 时间:2024/04/30 16:13
注意:下面的下载网址和版本有更新的以最新的为准
1. 在ubuntu下可以自动安装
- sudo apt-get install tesseract-ocr
2.编译安装
a.编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)
- yum install gcc gcc-c++ make
b.安装tesseract-ocr编译必须的包
- yum/apt-get install autoconf automake libtool
- yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
ubuntu
- sudo apt-get install libpng12-dev
- sudo apt-get install libjpeg62-dev
- sudo apt-get install libtiff4-dev
d.下载 leptonica 包: http://www.leptonica.org/source/leptonica-1.71.tar.gz
- wget http://www.leptonica.org/source/leptonica-1.71.tar.gz
- tar -zxvf ...
- ./configure
- make
- make install
需要注意,leptonica的版本问题
3.01 requires at least v1.67 of Leptonica.
3.02 requires at least v1.69 of Leptonica. (Both available in Ubuntu 12.04 Precise Pangolin.)
3.03 requires at least v1.70 of Leptonica. (Both available in Ubuntu 14.04 Trusty Tahr.)
如果版本不一致,会出现问题如下:
- Tesseract Open Source OCR Engine v3.02.02 with Leptonica
- Error in findTiffCompression: function not present
- Error in pixReadStreamTiff: function not present
- Error in pixReadStream: tiff: no pix returned
- Error in pixRead: pix not read
- Unsupported image type.
e.下载 tesseract-3.02 安装包: http://tesseract-ocr.googlecode.com/files/tesseract-3.02.02.tar.gz
- wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz
- ./autogen.sh
- ./configure
- make
- make install
- ldconfig
f.下载 tesseract-3.02 英文语言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz,解压后将 tesseract-ocr/tessdata 下的所有文件全部拷贝到 /usr/local/share/tessdata 下。
测试
- tesseract phototest.tif phototest -l eng
0 0
- 在linux下安装tesseract-ocr
- linux下安装tesseract-ocr
- Linux下tesseract-ocr安装
- Tesseract-OCR在MAC下的安装
- Tesseract-OCR在MAC下的安装
- linux下离线安装tesseract-ocr
- linux下离线安装tesseract-ocr
- linux 安装Tesseract-OCR
- linux 安装Tesseract-OCR
- Tesseract-ocr在Ubuntu12.04下的安装下详解
- mac下安装tesseract-ocr
- 【OCR】CentOS7下编译安装tesseract-ocr
- 【转】linux 安装Tesseract-OCR
- CentOS下编译安装tesseract-ocr
- centos下安装Tesseract OCR libs
- CentOS7下编译安装tesseract-ocr
- Linux下OCR识别引擎tesseract使用方法
- linux安装tesseract以及python调用tesseract-ocr
- SVN切换路径的方法
- 安卓补间动画Tween Animation
- iOS~runtime理解
- 关于博客中转载和原创的文章
- 数据结构中,“结点”的意思
- 在linux下安装tesseract-ocr
- 16
- HMAC加密算法
- dragger2 的使用详解
- 15电气二班徐立立(十进制转为二进制)
- 【问题解决】eclipse ‘Launching Hello'has encountered a problem
- easyUI使用准备
- 十进制转换成二进制
- BootStrap fileinput.js