使用Python进行简单的验证码识别

来源:互联网 发布:剑网三捏脸数据百度云 编辑:程序博客网 时间:2024/06/06 23:05

0、环境

系统:Windows7 旗舰版 64位

Python:2.7.12

Pycharm: profession 2016.2


1、资源集合

Pillow-2.2.1.win-amd64-py2.7.exe: http://download.csdn.net/detail/ethantang520/9608443

tesseract-ocr-setup-3.02.02.exe: http://download.csdn.net/detail/ethantang520/9608447

pytesseract-0.1.6.tar.gz: http://download.csdn.net/detail/ethantang520/9608449

pytesser_v0.0.1.zip: http://download.csdn.net/detail/ethantang520/9608499


2、PIL/Pillow

由于PIL没有64位的安装包,所以用Pillow替代

这里使用Pillow-2.2.1.win-amd64-py2.7.exe进行安装

官方下载页:https://pypi.python.org/pypi/Pillow/2.2.1#downloads


3、tesseract-ocr

官方下载页https://sourceforge.net/projects/tesseract-ocr,此处只有源码,需自行编译

这里使用tesseract-ocr-setup-3.02.02.exe进行安装


4、此处分为两套方案,任选其一

4-a、pytesseract

官方下载页:https://pypi.python.org/pypi/pytesseract

这里下载到的包名为: pytesseract-0.1.6.tar.gz

解压后,执行命令:python setup.py install

将解压目录下的pytesseract-0.1.6\build\lib\pytesseract 拷贝至Python安装路径下的Lib\site-packages文件夹,如:

D:\Program Files (X86)\Python27\Lib\site-packages

该方案代码:

import pytesseractfrom PIL import Imageimage = Image.open("C:\Users\Ethan\Desktop\image_test.png")# image.show()text = pytesseract.image_to_string(image)print text


4-b、pytesser

官方下载页https://code.google.com/archive/p/pytesser/downloads

这里下载到的包名为:pytesser_v0.0.1.zip

将 pytesser_v0.0.1.zip 解压后全部文件与调用的代码文件放在一起,必须放在一起(拍黑板!!!)

修改解压出来的pytesser.py文件:第六行的 import Image ,改成 from PIL import Image

若使用PIL,是否需要修改则具体视Image模块的路径

该方案代码:

from pytesser import *from PIL import Imageimage = Image.open("C:\image_test.png")# image.show()text = image_to_string(image)print text


参考文章:

http://www.cnblogs.com/xjin/p/4107720.html?utm_source=tuicool&utm_medium=referral

http://www.cnblogs.com/yeayee/p/4955506.html?utm_source=tuicool&utm_medium=referral

http://blog.csdn.net/nwpulei/article/details/8457738

http://vipscu.blog.163.com/blog/static/18180837220134234528457



0 0
原创粉丝点击