【Python】【验证码识别】python 模拟登陆时，验证码自动识别问题

来源：互联网发布：淘宝导航条hot图标编辑：程序博客网时间：2024/06/05 05:58

Tesseract-OCR的简单使用与训练

Tesseract-OCR是设什么？

Tesseract，一款由HP实验室开发由Google维护的开源OCR（Optical Character Recognition , 光学字符识别）引擎，与Microsoft Office Document Imaging（MODI）相比，我们可以不断的训练的库，使图像转换文本的能力不断增强；

我们所需软件

Tesseract-OCR 下载地址传送门
jTessBoxEditor 下载地址传送门

Tesseract-OCR软件安装,我们不作介绍，很简单，不会的可以百度下

安装好的截图

这里写图片描述

cmd测试安装是否成功

这里写图片描述

如何提升tesseract识别准确率？

tesseract可以识别验证码不假！可是不够准确，我们想要提高准确率，这时我们讲可以使用 jTessBoxEditor 来训练样本，提升识别的准确性！

我们准备样本文件（注意样本必须是.tif/.fiff格式的）

这里写图片描述

Merge样本文件

【注意】：样本图像文件格式必须为tif\tiff格式，否则在Merge样本文件的过程中会出现 Couldn’t Seek 的错误。

打开jTessBoxEditor，Tools->Merge TIFF，将样本文件全部选上，并将合并文件保存为zhiTong.font.exp0.tif
我这里一直是（我这里虽然是tif格式的图片，依然出现了Couldn’t Seek 错误）

方式二：我们借助TiffToy.exe

TiffToy.exe下载地址传送门

这里写图片描述

生成BOX文件

打开命令行【cmd】并切换至zhiTong.font.exp0.tif所在目录，输入，生成文件名为zhiTong.font.exp0.box

tesseract zhiTong.font.exp0.tif zhiTong.font.exp0 batch.nochop makebox

【语法】：tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] batch.nochop makebox

lang为语言名称，fontname为字体名称，num为序号；在tesseract中，一定要注意格式。

字符矫正

打开jTessBoxEditor，BOX Editor -> Open，打开zhiTong.font.exp0.tif；
这里写图片描述

修改char对应位置的字符，修改完成后记得  【save】 保存

修改char对应位置的字符

在目标文件下【cmd】执行

echo font 0 0 0 0 0 >font_properties自动生成 font_properties文件

这里写图片描述

方法二：直接在目标文件下，新建一个txt,命名为font_properties在里边写内容：font 0 0 0 0 0 #【注意】最后一定txt的文件后缀名去掉，也就是去掉".txt"

批处理文件

在【cmd】下执行批处理程序，一定要在cmd下找到目标文件下运行该命令：

echo Run Tesseract for Training.. tesseract.exe zhiTong.font.exp0.tif zhiTong.font.exp0 nobatch box.train echo Compute the Character Set.. unicharset_extractor.exe zhiTong.font.exp0.box mftraining -F font_properties -U unicharset -O zhiTong.unicharset zhiTong.font.exp0.tr echo Clustering.. cntraining.exe zhiTong.font.exp0.tr echo Rename Files.. rename normproto zhiTong.normproto rename inttemp zhiTong.inttemp rename pffmtable zhiTong.pffmtable rename shapetable zhiTong.shapetable  echo Create Tessdata.. combine_tessdata.exe zhiTong.

成功后，生成如下文件：
这里写图片描述

我们将zhiTong.traineddata拷贝到 C:\Program Files (x86)\Tesseract-OCR\tessdata（Tesseract-OCR安装位置下的tessdata 下）
这里写图片描述

我们在【Python】中调用识别库，识别验证码

这里写图片描述

#一般我们网页识别验证码，是通过对网页验证码保存本地,然后在通过识别库，识别输出的newImg = Image.open('C:/Users/Administrator/Desktop/pic/11.jpg')text = pytesseract.image_to_string(newImg,lang='zhiTong')#lang='我们刚才新建的识别库'print(text)

网页验证码处理：def auto_img():    driver.get_screenshot_as_file("D:/test2/智通图片/img.jpg") #对整个网页    imgelement = driver.find_element_by_xpath('.//*[@id="captcha_image"]')  # 定位验证码    location = imgelement.location  # 获取验证码x,y轴坐标    size = imgelement.size  # 获取验证码的长宽    rangle = (int(location['x'] + 10), int(location['y']), int(location['x'] + size['width'] - 20),              int(location['y'] + size['height']))  # 写成我们需要截取的位置坐标    i = Image.open("D:/test2/智通图片/img.jpg")  # 打开截图    i = i.convert('RGB')    frame4 = i.crop(rangle)  # 使用Image的crop函数，从截图中再次截取我们需要的区域    frame4.save('D:/test2/智通图片/new.jpg')    qq = Image.open('D:/test2/智通图片/new.jpg')    #我开始对图片，做了二值化处理，可以忽略    imgry = qq.convert('L')  # 图像加强，二值化    sharpness = ImageEnhance.Contrast(imgry)  # 对比度增强    sharp_img = sharpness.enhance(2.0)    sharp_img.save("D:/test2/智通图片/new1.jpg")    new2 = Image.open('D:/test2/智通图片/new1.jpg')    return code

至此，我们就可以实现验证码识别，自动验证登录功能！

阅读全文

3 0