Notes—Tesseract-OCR使用
来源:互联网 发布:二元相图软件 编辑:程序博客网 时间:2024/06/14 03:32
1.下载tesseract-ocr-setup-3.02.02.exe 直接安装,简单方便,安装选项默认。安装后的目录里面的文件如下:
2.将要识别的文字图片放在目标文件夹中,如D盘。在D盘中Shift+右键打开命令行。因为环境变量在安装的时候就已经自动配置好了,所以在命令行下直接输入tesseract,如果显示下图信息则表示安装成功。
3.对测试的文字图片进行识别,命令行输入
tesseract imagename outputbase [-l eng] [-psm pagesegmode]
其中 :
imagename是图片文件名(如果命令行当前所在目录与测试图片存放目录一致,就用img.jpg这种就可以了……如果命令行当前所在目录不是测试用图片存放目录,需要用图片的绝对路径)
outputbase是图片识别后输出的文件名 路径规则同imagename 输出文件格式为txt 因此输出文件名不需要加后缀名
-l lang 是选择识别时所用的字库 英文字库名为eng 中文字库名为chi_sim 该参数为可选参数 默认为英文字库
-psm pagesegmode 也是一个可选参数默认值为3 不同的值用来说明待识别图片 提高识别率,不同值的含义如下:
0 =只进行定向和脚本检测(OSD)
1 =通过OSD进行页面自动分割
2 =自动分割,但没有OSD,或OCR
3 =全自动分割,但没有OSD(默认)
.4 =假设待识别图片是一列的文本
5 =假设待识别图片是一个统一的垂直对齐的文本块
6 =假设待识别图片是一个统一的文本块
7 =把图像作为一个单一的文本行
8 =把图像当作一个字
9 =把图像作为一个字在一个圆圈中
10 =把图像当作一个单独的字符
- Notes—Tesseract-OCR使用
- tesseract-ocr 使用简介
- tesseract-ocr 使用笔记
- tesseract-ocr ubuntu 安装使用
- c++中使用Tesseract-OCR
- tesseract-ocr ubuntu 安装使用
- c++中使用Tesseract-OCR
- Java——Tesseract-OCR使用中文包报错read_params_file
- tesseract-ocr
- ocr tesseract
- Tesseract OCR
- Tesseract OCR
- tesseract ocr
- Tesseract-ocr
- Tesseract ocr
- Tesseract-OCR
- tesseract-ocr
- Tesseract(tesseract-ocr)在Visual Studio 2013中的使用
- 【Leetcode】191. Number of 1 Bits
- 51 单片机简单的多任务调度例子
- 第2周-数据获取与表示
- json描述
- 蓝桥杯 BEGIN-1 入门训练 A+B问题
- Notes—Tesseract-OCR使用
- 性能测试基础知识
- angularJs中自定义指令transclude与templateUrl详解
- java 排序方法--选择排序(2)
- spring学习-1 入门
- 开启apache的url rewrite模块
- PAT 1003. Emergency Dijkstra变形+求相等最短路的数量+特殊权重
- 【OpenGL】OpenGL矩阵变换详解
- 编译安装OPENSSL和APACHE