三种验证码的识别途径

来源:互联网 发布:淘宝客如意投计划 编辑:程序博客网 时间:2024/05/17 17:57
BAIDU贴吧验证码识别很困难,有干扰线,字符粘连,以及多种字体变形,大小不同,也没有好的算法分割字符,和腾讯的一样难识别。
我实验了一种方法,用这思路成功去除了干扰线,并且识别出一种字体,后期添加字模以及完善还需要一两个月时间,因工作原因,没时间再写代码了,在研究验证码识别的可以联系知码网哦。
      这套完整的识别系统自带点阵提取,能批量提取字符特征,稍微改一下,也能识别盛大、新浪等这类带粘连的复杂验证码了,一个识别用的DLL售价上千。
源码都有注释,包括如何去除干扰线,如何二值化、细化骨架化、除噪声、如何一次提取点阵等算法,运算的模块用C++编写速度还能提高不少,有编程基础都能看懂,关键是算法,这是网上没有的,代码哪里不清楚的随时咨询。

     还有传说中的形状上下文识别C#源码,不是MATLAB的,形状上下文是识别粘连字符的终极武器。

文章摘自:www.zhima365.com