Python调用Tesseract-OCR 3.0.4
来源:互联网 发布:吉利知豆d3图片 编辑:程序博客网 时间:2024/05/17 22:19
注意事项:一.确认本地python版本,最好2.7以上。确认ctypes和os包在python中
方法:命令行输入python进入python环境
输入import ctypes
help(ctypes)
os同理
二.注意3.0.4和3.0.2的api不同。官网上是3.0.2的版本,使用会报错。
三.找到/etc/ld.so.conf打开后添加一行:/usr/local/lib然后执行/sbin/ldconfig -v
四.注意图片不要放在根目录下,要写绝对路径
代码如下:
#coding=utf-8
import os
import ctypes
lang = "eng+chi_sim" #语言包名称
filename ="/usr/local/6.jpg" #图片文件位置
libname ="/usr/local/lib/libtesseract.so.3" #类库的位置,tesseract默认将libtesseract.so.3安装在左侧路径,若不然则使用locate定位这个文件,输入正确的路径位置
TESSDATA_PREFIX ="/usr/local/share" #指定traindata的位置,默认为左侧路径
tesseract =ctypes.cdll.LoadLibrary(libname) #实例化对象
api = tesseract.TessBaseAPICreate()
rc = tesseract.TessBaseAPIInit3(api,TESSDATA_PREFIX, lang)
if (rc):
tesseract.TessBaseAPIDelete(api)
print("Could not initialize tesseract.\n")
exit(3)
tesseract.TessBaseAPIProcessPages(api,filename, None, 0, None)
text_out =tesseract.TessBaseAPIGetUTF8Text(api)
result_text = ctypes.string_at(text_out)
print(result_text) #输出结果
- Python调用Tesseract-OCR 3.0.4
- OCR----Python调用Tesseract引擎(Ubuntu下)
- linux安装tesseract以及python调用tesseract-ocr
- [python]Tesseract OCR训练
- Python.Tesseract -- OCR
- python + tesseract OCR 文字识别
- 4 Tesseract-ocr 系列 : 开源OCR比较
- Training Tesseract OCR 3.0.1
- java 调用tesseract-ocr识别图片
- tesseract OCR库在vs2010中的调用
- tesseract OCR库在vs2010中的调用
- python pytesser tesseract-ocr 验证码识别
- tesseract-ocr
- ocr tesseract
- Tesseract OCR
- Tesseract OCR
- tesseract ocr
- Tesseract-ocr
- 静态编译,动态编译,静态链接库,动态链接库
- java中成员初始化与构造器初始化的顺序
- 283. Move Zeroes
- 【洛谷 2376】 [USACO09OCT]津贴Allowance
- React Native未来导航者:react-navigation 使用详解
- Python调用Tesseract-OCR 3.0.4
- robotframework 自动化测试 sql 语句 遇到的问题
- 关于卷积核为何有效的初级理解
- diff比较两个文件之间的差异
- 二维插值的三维显示
- zxing实现二维码生成和解析
- poj3017Cut the Sequence
- Android Binder 机制初步学习 笔记(三)—— Binder 进程通讯库简介
- 量化分析(5)——Python应用tushare数据计算单资产CAPM实例