使用Python进行简单的验证码识别
来源:互联网 发布:剑网三捏脸数据百度云 编辑:程序博客网 时间:2024/06/06 23:05
0、环境
系统:Windows7 旗舰版 64位
Python:2.7.12
Pycharm: profession 2016.2
1、资源集合
Pillow-2.2.1.win-amd64-py2.7.exe: http://download.csdn.net/detail/ethantang520/9608443
tesseract-ocr-setup-3.02.02.exe: http://download.csdn.net/detail/ethantang520/9608447
pytesseract-0.1.6.tar.gz: http://download.csdn.net/detail/ethantang520/9608449
pytesser_v0.0.1.zip: http://download.csdn.net/detail/ethantang520/9608499
2、PIL/Pillow
由于PIL没有64位的安装包,所以用Pillow替代
这里使用Pillow-2.2.1.win-amd64-py2.7.exe进行安装
官方下载页:https://pypi.python.org/pypi/Pillow/2.2.1#downloads
3、tesseract-ocr
官方下载页:https://sourceforge.net/projects/tesseract-ocr,此处只有源码,需自行编译
这里使用tesseract-ocr-setup-3.02.02.exe进行安装
4、此处分为两套方案,任选其一
4-a、pytesseract
官方下载页:https://pypi.python.org/pypi/pytesseract
这里下载到的包名为: pytesseract-0.1.6.tar.gz
解压后,执行命令:python setup.py install
将解压目录下的pytesseract-0.1.6\build\lib\pytesseract 拷贝至Python安装路径下的Lib\site-packages文件夹,如:
D:\Program Files (X86)\Python27\Lib\site-packages
该方案代码:
import pytesseractfrom PIL import Imageimage = Image.open("C:\Users\Ethan\Desktop\image_test.png")# image.show()text = pytesseract.image_to_string(image)print text
4-b、pytesser
官方下载页:https://code.google.com/archive/p/pytesser/downloads
这里下载到的包名为:pytesser_v0.0.1.zip
将 pytesser_v0.0.1.zip 解压后全部文件与调用的代码文件放在一起,必须放在一起(拍黑板!!!)
修改解压出来的pytesser.py文件:第六行的 import Image ,改成 from PIL import Image
若使用PIL,是否需要修改则具体视Image模块的路径
该方案代码:
from pytesser import *from PIL import Imageimage = Image.open("C:\image_test.png")# image.show()text = image_to_string(image)print text
参考文章:
http://www.cnblogs.com/xjin/p/4107720.html?utm_source=tuicool&utm_medium=referral
http://www.cnblogs.com/yeayee/p/4955506.html?utm_source=tuicool&utm_medium=referral
http://blog.csdn.net/nwpulei/article/details/8457738
http://vipscu.blog.163.com/blog/static/18180837220134234528457
- 使用python以及工具包进行简单的验证码识别
- 使用Python进行简单的验证码识别
- 利用Python进行简单的图像识别(验证码)
- 利用Python进行简单的验证码识别步骤
- 使用Python进行验证码识别
- 使用Python进行验证码识别
- 使用Python进行验证码识别
- 简单验证码识别的python脚本
- Python简单的验证码识别
- python 使用tesseract-ocr , pytesseract , PIL进行验证码识别
- python简单验证码识别
- python简单验证码识别
- python验证码简单识别
- 使用tesseract-ocr进行简单的验证码识别和训练
- 利用PIL对简单的验证码进行识别
- 关于利用python进行验证码识别的一些设想
- pytesseract的简单验证码的识别-python
- 利用python pytesser 识别简单验证码
- 压缩感知稀疏基之离散哈特莱变换(DHT)和离散W变换
- 枚举 讨厌的青蛙
- nginx 本地nginx.conf配置文件
- android开发过程中解决bug的方法
- 主线程中也不绝对安全的 UI 操作
- 使用Python进行简单的验证码识别
- 局域网文件与打印机共享
- OC——通知(NSNotificationCenter)基本声明方法
- 迭代器 iterator
- 侧拉新闻菜单
- 压缩感知稀疏基之离散小波变换
- HTML5新特性笔记
- Docker常见命令---简易教程
- 解释:i=i++