识别验证码方法学习过程

来源:互联网 发布:手机点位图软件 编辑:程序博客网 时间:2024/06/05 04:04

1.读取图片到内存(一般是读取一张之后在复制一张以免该颜色该乱掉)

2.色差:
将第两个个颜色  R^2+G^2+B^2  开方  做差后的绝对值的范围就是色差(自己语言定义的不专业)

3.灰阶处理
 RGB值全部设置成灰度值 Gray=( 0.299*R  +   0.587*G  +  0.114B)

Tesseract 插件可以用(Tess4J)
1.先获取样本图片并修正
2.让tesseract自由学习
3.我们纠正tesseract


采样修正:
1.去掉边框
2.颜色过滤:(去取色后去除干扰色,色差、枚举等手段去除)
3.返回这张图片(.tif格式)
4.将jTessBoxEdior(用java写的)合并处理过的验证码(用window图片查看器查看有翻页)
运行tesseract.exe 
>tesseract.exe 处理文件名.tif 识别结果名词 ?????
在用JTessBoxEdior 打开进行矫正


具体文档地址:


原创粉丝点击