tesseract验证码训练部骤
来源:互联网 发布:淘宝怎样退换货 编辑:程序博客网 时间:2024/06/04 18:36
先简单记录下,以后再详细
1、使用jTessBoxEditor将验证码jpg文件merge tif合并成一个tif
2、生成box
tesseract eng.ver.exp0.tif eng.ver.exp0. -psm 7 -l eng batch.nochop makebox
3、使用jTessBoxEditor对box文件对比tif一个个字符校正
4、生成.tr训练文件
tesseract.exe eng.ver.exp0.tif eng.ver.exp0 -psm 7 nobatch box.train
3、新建文件font_properties,内容为ver 0 0 0 0 0 ,其中ver为上面的文件名第二个字段即字体名,需保存为无BOM的UTF8文件。
unicharset_extractor eng.ver.exp0.box
4、定义字体特征文件
mftraining.exe -F font_properties -U unicharset
5、完成训练
cntraining.exe eng.ver.exp0.tr
会产生5个文件:
inttemp
normproto
pffmtable
shapetable
unicharset
6、将以上文件改名,加上前缀selfverify.,注意有一点.,然后合并成为selfverify.traineddata文件
combine_tessdata.exe selfverify.
7、拷贝生成的selfverify.traineddata到tessdata目录
8、测试训练成果
tesseract test.jpg test -psm 7 -l selfverify
但本人测试却无法解析,不知道为何- -!待解决中。。。
1、使用jTessBoxEditor将验证码jpg文件merge tif合并成一个tif
2、生成box
tesseract eng.ver.exp0.tif eng.ver.exp0. -psm 7 -l eng batch.nochop makebox
3、使用jTessBoxEditor对box文件对比tif一个个字符校正
4、生成.tr训练文件
tesseract.exe eng.ver.exp0.tif eng.ver.exp0 -psm 7 nobatch box.train
3、新建文件font_properties,内容为ver 0 0 0 0 0 ,其中ver为上面的文件名第二个字段即字体名,需保存为无BOM的UTF8文件。
unicharset_extractor eng.ver.exp0.box
4、定义字体特征文件
mftraining.exe -F font_properties -U unicharset
5、完成训练
cntraining.exe eng.ver.exp0.tr
会产生5个文件:
inttemp
normproto
pffmtable
shapetable
unicharset
6、将以上文件改名,加上前缀selfverify.,注意有一点.,然后合并成为selfverify.traineddata文件
combine_tessdata.exe selfverify.
7、拷贝生成的selfverify.traineddata到tessdata目录
8、测试训练成果
tesseract test.jpg test -psm 7 -l selfverify
但本人测试却无法解析,不知道为何- -!待解决中。。。
0 0
- tesseract验证码训练部骤
- Tesseract-OCR 验证码训练
- 使用Tesseract破解验证码并训练字库的方法
- Tesseract引擎 验证码
- tesseract-ocr 提高验证码识别率手段之---识别码库训练方法
- tesseract-ocr 提高验证码识别率手段之---识别码库训练方法
- 使用tesseract-ocr进行简单的验证码识别和训练
- tesseract训练
- tesseract 训练-
- Tesseract:训练
- Tesseract:训练
- Tesseract:训练
- 训练tesseract
- 训练Tesseract
- tesseract-ocr破解 验证码
- 验证码的识别tesseract
- 【Tesseract】Tesseract 的训练流程
- 用 tesseract 和 CxImage 扫描验证码
- 简析TCP的三次握手与四次分手
- 嵌入式,单片机,硬件
- Cocoa Touch事件处理流程--响应者链(转载)
- Linux搭建SVN服务器
- Spring(五)AOP
- tesseract验证码训练部骤
- hibernate---一对多关联映射
- 实验28
- Activity数据保存探索
- PopupWindow 注意点
- C#调用dll提示"试图加载格式不正确的程序"原因及解决方法
- 新手学习wpf记录 button上篇 等级3
- android中的线程池的使用
- jvm command 小计