验证码破解技术四部曲之环境搭建篇(一)
来源:互联网 发布:联想服务器数据恢复 编辑:程序博客网 时间:2024/05/16 05:08
验证码破解技术四部曲之环境搭建篇(一)
前言
转眼就变成大四狗了,大学期间做的比较深入的技术是爬虫,但是爬虫也有很多高级的技术没有涉及,比如说验证码的破解便是其中之一,再加上我对其非常感兴趣,于是乎,开始苦学图像处理、学习机器学习,验证码破解也有了些眉头。
以下是我破解的几种验证码。
1、最容易破解的验证码
直接使用tesseract库识别。
2、download.csdn的验证码
使用K近邻算法识别。
3、weibo.cn验证码
使用卷积神经网络训练识别。
说明
项目源码:https://github.com/nladuo/captcha-break (可以帮我点个star(^__^))
开发语言:python(编写爬虫),c++(编写图像处理部分以及机器学习算法)
开发环境:ubuntu 14.04
依赖库:
Python:PIL、BeautifulSoup4、requests
C++:boost、opencv2、tesseract-ocr
环境搭建
安装opencv 2.4.12
sudo apt-get install build-essential cmake libgtk2.0-dev pkg-config python-dev python-numpy libavcodec-dev libavformat-dev libswscale-dev wget https://codeload.github.com/Itseez/opencv/zip/2.4.12unzip opencv-2.4.12.zipcd opencv-2.4.12 ; mkdir release ; cd release cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local .. make -j8sudo make install
安装tesseract-ocr
sudo apt-get install tesseract-ocr tesseract-ocr-dev
安装boost
sudo apt-get install libboost-dev
安装python的PIL库
sudo apt-get install python-imaging
安装python的BeautifulSoup4、requests库
sudo apt-get install python-pipsudo pip install bs4sudo pip install requests
下载项目源码
git clone https://github.com/nladuo/captcha-break.git
0 0
- 验证码破解技术四部曲之环境搭建篇(一)
- 验证码破解技术四部曲之环境搭建篇(一)
- 验证码破解技术四部曲之使用Tesseract(二)
- 验证码破解技术四部曲之使用K近邻算法(三)
- 验证码破解技术四部曲之使用卷积神经网络(四)
- 验证码破解技术四部曲之使用Tesseract(二)
- 验证码破解技术四部曲之使用K近邻算法(三)
- 验证码破解技术四部曲之使用卷积神经网络(四)
- NoSQL之Redis技术(一):简介与环境搭建
- 验证码破解技术
- 验证码破解技术
- 百度大脑人脸识别深度验证与思考(一)之环境搭建
- 传智播客XMl比较四部曲--(一)个人总结
- 如何破解验证码之实战篇
- canny算子四部曲之二(求梯度)
- cocos2d-x游戏开发(一)之环境搭建篇
- 入门篇之 iOSOpenDev环境搭建(一)
- android之旅(一):环境搭建
- NSNull,nil
- [剑指offer学习心得]之:从尾到头打印链表
- codeforces 723D Lakes in Berland
- use CryptStringToBinary to unbase64
- window.location.search的用法
- 验证码破解技术四部曲之环境搭建篇(一)
- 1613-3-傅溥衍 总结《2016年10月5日》【连续第五天总结】
- CentOS 安装pip教程
- Triangle(长春 重现赛(斐波拉契数列))
- Add Binary
- 对javaweb中portal的理解
- Reverse Integer , Leetcode
- 二次排序(sort、冒泡)
- netinet