将jTessBoxEditor训练的字库合并
来源:互联网 发布:c 显示数据库数据控件 编辑:程序博客网 时间:2024/06/09 18:13
集成环境:win10,jTessBoxEditor-1.7.3
1.需要生成字符集的.tif和.box这俩个文件。
假设:需要合并三个字典liu.宋体.exp0,liu1.微软雅黑light.exp0,micrsoft.microsoftyaheiuilight.exp0(注:个人生成的字典有个人的名字,建议用自己的名字)
(1)将这三个字典的.tif和.box文件拷贝到一个文件夹下;
2.生成相对应的tr文件:
(1)生成liu.宋体.exp0的tr文件
命令:tesseract liu.宋体.exp0.tif liu.宋体.exp0 nobatch box.train(DOS下运行)
(2)生成liu1.微软雅黑light.exp0的tr文件
命令:tesseract liu1.微软雅黑light.exp0.tif liu1.微软雅黑light.exp0 nobatch box.train
(3)生成:micrsoft.microsoftyaheiuilight.exp0的tr文件
命令:tesseract micrsoft.microsoftyaheiuilight.exp0.tif micrsoft.microsoftyaheiuilight.exp0 nobatch box.train
3.从所有文件中提取字符
命令:unicharset_extractor liu.宋体.exp0.box liu1.微软雅黑light.exp0.box micrsoft.microsoftyaheiuilight.exp0.box
4.生成字体特征文件
新建font文件(注文件后缀没有.txt),把所有box对应的字体特征加进去。
fontname为字体名称,保持和 图片集文件 .tif 和.box文件的前缀名一致 ,italic> 、<bold> 、<fixed> 、<serif>、 <fraktur>的取值为1或0,表示字体是否具有这些属性。
例如我新建了一个 名为 font,内容 为
然后执行命令:mftraining -F font -U unicharset liu.宋体.exp0.tr liu1.微软雅黑light.exp0.tr micrsoft.microsoftyaheiuilight.exp0.tr
5.聚合所有的tr文件:
命令:cntraining liu.宋体.exp0.tr liu1.微软雅黑light.exp0.tr
6.重命名文件,我把unicharset, inttemp, normproto, pfftable ,shapetable这几个文件加了前缀why.(注:why.只是我给合成的字典的命名,个人随意)
7.合并所有文件,生成一个大的资库文件。
命令:combine_tessdata why.
注:由于花费了好多时间才搞出来的,所以写的有点啰嗦,望谅解。
- 将jTessBoxEditor训练的字库合并
- tesseract_ocr 字符识别基础及训练字库、合并字库
- tesseract_ocr 字符识别基础及训练字库、合并字库
- tesseract_ocr 合并字库 字符识别基础及训练字库、
- tesseract_ocr 字符识别基础及训练字库、合并字库
- jTessBoxEditor训练验证码图片
- jTessBoxEditor训练验证码图片
- tesseract 和jtessboxeditor 训练文字
- jTessBoxEditor训练3500常用汉字
- Tesseract-OCR 训练自己的中文字库
- 用jTessBoxEditor自动训练3500常用汉字
- tesseract训练字库
- Tesseract-ocr训练字库
- tesseract-OCR字库训练
- 如何将Tesseract两个训练文件合并
- 使用tesseract3.01字库训练教程完成全国企业信息中心简单验证码的字库建立。
- 使用Tesseract破解验证码并训练字库的方法
- 如何通过jTessBoxEditor进行Tesseract3.02.02样本训练
- 1000-输入输出LL(1)语法分析程序
- 【北京】微软技术直通车(第二期) 之 SQL Server 2017饕餮
- HDU3829-最大独立子集
- 基于python实现日志收集
- python函数-高阶函数和匿名函数
- 将jTessBoxEditor训练的字库合并
- 关于pl/sql远程连接oracle
- 自定义路由匹配和生成
- QT控件大全一AnalogWidgets
- 将string字符串转化为16进制字符串
- 反转链表
- VS调试Mex代码
- 关于java.lang.invoke包的解释
- 富文本wangEditor