Notes—Tesseract-OCR使用

来源：互联网发布：二元相图软件编辑：程序博客网时间：2024/06/14 03:32

1.下载tesseract-ocr-setup-3.02.02.exe 直接安装，简单方便，安装选项默认。安装后的目录里面的文件如下：
这里写图片描述

2.将要识别的文字图片放在目标文件夹中，如D盘。在D盘中Shift+右键打开命令行。因为环境变量在安装的时候就已经自动配置好了，所以在命令行下直接输入tesseract，如果显示下图信息则表示安装成功。
这里写图片描述

3.对测试的文字图片进行识别，命令行输入
tesseract imagename outputbase [-l eng] [-psm pagesegmode]
其中：

imagename是图片文件名（如果命令行当前所在目录与测试图片存放目录一致，就用img.jpg这种就可以了……如果命令行当前所在目录不是测试用图片存放目录，需要用图片的绝对路径）

outputbase是图片识别后输出的文件名路径规则同imagename 输出文件格式为txt 因此输出文件名不需要加后缀名

-l lang 是选择识别时所用的字库英文字库名为eng 中文字库名为chi_sim 该参数为可选参数默认为英文字库

-psm pagesegmode 也是一个可选参数默认值为3 不同的值用来说明待识别图片提高识别率，不同值的含义如下：

0 =只进行定向和脚本检测（OSD）

1 =通过OSD进行页面自动分割

2 =自动分割，但没有OSD，或OCR

3 =全自动分割，但没有OSD（默认）

.4 =假设待识别图片是一列的文本

5 =假设待识别图片是一个统一的垂直对齐的文本块

6 =假设待识别图片是一个统一的文本块

7 =把图像作为一个单一的文本行

8 =把图像当作一个字

9 =把图像作为一个字在一个圆圈中

10 =把图像当作一个单独的字符

阅读全文

0 0