Tesseract限制匹配的字符集
来源:互联网 发布:js的基本数据类型 编辑:程序博客网 时间:2024/05/17 06:31
在OCR过程中,我发现,如果能够限制匹配的字符集,那么肯定能够大大提高识别效率,但是能不能支持呢?我查了很多资料,都没有明确答案,最后,在stackoverflow终于找的了答案。
翻译过来。
Q:
Is it possible to limit the set of characters that tesseract is looking for (e.g. search only for letters a-z)? That would improve my results greatly.
A:
Create a config file (e.g "letters") in tessdata/configs directory - usually
在特定文件夹中,创建一个配置文件,文件夹通常在
/usr/share/tesseract/tessdata/configsor
/usr/share/tesseract-ocr/tessdata/configs
And add this line to the config file:
填入一行配置,即你要加入的字符集
tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz
...or maybe [a-z] works.. dunno :-)
Then call tesseract similar to this:
然后在调用命令时候,要用以下形式:
tesseract input.tif output nobatch letters
That will limit tesseract to recognize only the wanted characters
这就把匹配字符集限制在你自定义的范围内了。第一次做翻译,翻译完后才发现这难度,完全没必要,哈哈。不过,作为我的第一次翻译,意义还是有的。
- Tesseract限制匹配的字符集
- 【Tesseract】Tesseract 的训练流程
- 发现,pcre还有匹配长度的限制
- mysql数据库字符集限制主键长度的问题记录
- oracle:字符集不匹配
- MySQL中文查询时的字符集匹配问题的解决
- vs2005中字符集不匹配的一个问题
- MySQL中文查询时的字符集匹配问题
- sybase bcp导入导出遇到字符集不匹配的问题解决
- ORACLE 服务端与客户端字符集的匹配,解决中文乱码
- 字符匹配:查找包含字符集的子串-和谐系统
- 解决mysql 查询字符集不匹配的问题
- Tesseract-ocr的安装
- 配置tesseract的方法
- tesseract的编译安装
- tesseract的使用
- Tesseract的所有参数
- Tesseract 4.0的安装
- jqmobi嵌入google map 问题
- 简单 却爱
- jspsmartupload 不算bug的bug
- Camera Shake in Unity
- eclipse android环境配置
- Tesseract限制匹配的字符集
- explicit构造函数
- 实现功能
- C、C-plusplus语言中Chinese character的编码剖析
- 0/1背包问题算法思路精讲
- Android实战之手势与多点触控探究
- 高清图像系统-DPS(Digital Pixel System)技术简介
- :整数中1出现的次数
- nefu 120 梅森素数 Lucas-Lehmer判定法