Tesseract-OCR 安装
来源:互联网 发布:淘宝女装客服话术 编辑:程序博客网 时间:2024/06/16 02:52
1、安装编译环境
yum install gcc gcc-c++ make
yum groupinstall "Development Tools"
yum install autoconf automake libtool
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
2、下载编译依赖库
3.04版本
wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure && make && make install
3.01的
wget http://www.leptonica.org/source/leptonica-1.68.tar.gz
tar -xvf leptonica-1.68.tar.gz
cd leptonica-1.68
./configure && make && make install
3、下载编译 tesseract-ocr (注意这里下载下来的包要放在leptonica-1.72 下,否则编译的时候会出问题)
3.04版本
wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./autogen.sh
./configure
make && make install
3.01版本
wget http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz
tar -xvf Tesseract-3.01.tar.gz
cd tesseract-3.01/
./autogen.sh
./configure
make && make install
4、下载识别字体的字体文件
3.04版本
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
3.01版本
<自行到网络下载...>
5、将tesseract-ocr的字体文件拷贝到/usr/local/share/tessdata/下
cp *.traineddata /usr/local/share/tessdata/
6、配置字体文件的环境变量 vi /etc/profile (编译完成后需要source/etc/profile )
export TESSDATA_PREFIX=/usr/local/share/
7、拷贝.so文件
cp /usr/local/lib/*.so.* /usr/lib64/
搞定 !
阅读全文
0 0
- Tesseract-ocr的安装
- linux 安装Tesseract-OCR
- 安装Tesseract-OCR
- linux 安装Tesseract-OCR
- mac 安装tesseract-ocr
- Tesseract-OCR引擎安装
- centos7 tesseract-ocr 安装
- tesseract-ocr安装
- Tesseract-OCR 安装
- Tesseract-OCR 4.0+ 安装
- 【OCR】CentOS7下编译安装tesseract-ocr
- tesseract-ocr ubuntu 安装使用
- centos 5.2安装Tesseract-OCR
- 【转】linux 安装Tesseract-OCR
- linux下安装tesseract-ocr
- mac下安装tesseract-ocr
- tesseract-ocr ubuntu 安装使用
- macbook 安装tesseract-ocr
- 超实用的CAD技巧,教你如何将CAD转换成PDF
- 把数组排列成最小的数
- 进制转换
- pycharm错误运行报告(完善中)
- 安卓调用手机自带的浏览器
- Tesseract-OCR 安装
- DFS-lintcode生成括号
- JavaNIO学习之Buffer
- HTTP
- 百度定位
- Spring 开启Annotation <context:annotation-config> 和 <context:component-scan>诠释及区别
- JS显示当前时间(包含农历时间)
- mac系统如何设置输入ipython对应2.X、输入ipython3对应3.X版本python
- 随笔小记--微博手动扩容来解决因新热搜“鹿晗关晓彤恋情”引起的down机