ocr识别
来源:互联网 发布:耳饰饰品店 知乎 编辑:程序博客网 时间:2024/04/30 17:30
出处:http://www.oschina.net/news/51223/aspose-ocr-for-dotnet-1-9-0
http://www.cnblogs.com/ivanyb/archive/2011/11/25/2263043.html
Aspose.OCR for .NET 1.9.0 发布,Aspose.OCR for .NET 是一个光学识别组件,可在 ASP .NET 的 Web 应用、Web 服务和应用程序中增加 OCR 功能,提供了简单的类用来控制识别任务,支持 BMP 和 TIFF。
改进内容包括:
You can now set thresholds for a template, template page, and for a specific template element.
The threshold is usually set to an acceptable higher average value before initializing the OMR procedure to determine the amount of pixels (as a percent) required before a field or a mark is considered checked or filled.
This release also supports equal spacing between the markers.
This enhancement has been made for the OmrEngine to accommodate markers that are equally distributed on the OMR template.
相关链接
- Aspose.OCR for .NET 的详细介绍:请点这里
- Aspose.OCR for .NET 的下载地址:请点这里
之前我在<<C#简单数字验证码解析>>一文中介绍了用C#识别简单不变形数字验证码,但是对于识别变形的 或生成位置变化比较频繁的 验证码的准确率却不高。
下面介绍一个开源的OCR引擎Tesseract2。值得庆幸的是虽然是开源的但是它的识别率较高,并不比其他引擎差劲。网上介绍Tessnet2也是当时时间排名第三的识别引擎,只是后来慢慢不维护了,目前是Google在维护,大家都知道Google 在搞电子图书馆,每天都有不同类目的书被扫描成电子版。所以有G老大维护,识别率差不到哪里去。呵呵。。别鄙视我。。。
Tessnet2 是用vc ++ 开发的,其中是生成Tessnet2.dll ,我们可以通过.net 来调用内部具体类库实现识别。
Tessnet2的使用:
1、点击http://files.cnblogs.com/zhuxiangyu/tessnet2_32.rar链接下载Tessnet2.dll ,
Tessnet2是支持多国语的。语言包下载链接:http://code.google.com/p/tesseract-ocr/downloads/list
2、将Tessnet2.dll 添加到vs 引用中,和添加.net程序集一样。
3、用Tessnet2进行识别
WebRequest request = WebRequest.Create(
"http://sz.2zf.cn/js/code2.asp"
);
WebResponse response = request.GetResponse();
Stream st = response.GetResponseStream();
Bitmap bitmap = (Bitmap)Bitmap.FromStream(st);
UnCodebase ud =
new
UnCodebase(bitmap );
bitmap = ud.GrayByPixels();
ud.ClearNoise(128, 2);
pictureBox1.Image = bitmap ;
tessnet2.Tesseract ocr =
new
tessnet2.Tesseract();
//声明一个OCR类
ocr.SetVariable(
"tessedit_char_whitelist"
,
"0123456789"
);
//设置识别变量,当前只能识别数字。
ocr.Init(Application.StartupPath +
@"\\tmpe"
,
"eng"
,
true
);
//应用当前语言包。注,Tessnet2是支持多国语的。语言包下载链接:http://code.google.com/p/tesseract-ocr/downloads/list
List<tessnet2.Word> result = ocr.DoOCR(bitmap , Rectangle.Empty);
//执行识别操作
string
code = result[0].Text;
textBox1.Text = code;
识别效果:
代码下载:CSharp简单数字验证码解析.rar
http://files.cnblogs.com/ivanyb/CSharp%E7%AE%80%E5%8D%95%E6%95%B0%E5%AD%97%E9%AA%8C%E8%AF%81%E7%A0%81%E8%A7%A3%E6%9E%90.rar
- ocr识别
- ocr识别
- OCR识别
- ocr识别
- OCR云识别之云识别OCR
- 手机身份证识别OCR识别
- OCR文字识别
- C#关于OCR识别
- ocr 字符识别 项目
- tesseract-ocr识别字符
- OCR验证码识别
- OCR字符识别
- java ocr 识别中文
- 光学字符识别 OCR
- 光学字符识别 OCR
- linux ocr 识别
- Android OCR识别库
- OpenCV进行OCR识别
- 采集(file_get_contents)
- java集合框架01——总体框架一览
- LeetCode 143. Reorder List
- 网络:登录界面搭建与数据保存
- dp基础习题(4.13)
- ocr识别
- curl进行传值(post)
- Android手机上生成随机验证码(详细注释)
- java集合框架02——Collection架构与源码分析
- HTTP协议详解
- 类、抽象类、接口
- Tricks(三十四)—— 判断某一属性列是数值型还是标称型
- 行人检测 读书笔记 综述(3)2007
- 跨线程实时更新进度类