开源ocr库
来源:互联网 发布:mac照片排序 编辑:程序博客网 时间:2024/06/11 05:40
开源的OCR库,Opensourced OCR library
突然想起如何做一个论坛的发帖机,但是现在多数都要图片认证,需要一个OCR库来识别图片。于是在网上找了找,还真是有很多实现:
- OCRE, OCR Easy, http://lem.eui.upm.es/ocre.html
- Clara OCR, http://directory.fsf.org/claraocr.html
- Ocrad, based on a feature extraction, http://directory.fsf.org/ocrad.html
- GOCR, http://sourceforge.net/projects/jocr
- OCRchie: Modular Optical Character Recognition Software, http://http.cs.berkeley.edu/~fateman/kathey/ocrchie.html
- sf.net上还有很多正在进行的项目,不过大多数还停留在设想阶段
现在的问题,是测试这些库。不过猜测,这些OCR对付国内的网站还行,像MSN这样的图片肯定无效了。
下载这些程序分别测试了一下,
gocr和ocrad稍作修改可在Windows下编译运行。gocr用vc6, ocrad用gcc。
OCRE,OCRchie和clara OCR需要X window或gtk不太好编译。
测试了一下sina, baidu, taobao,他们都或多或少做了干扰噪音,所以基本不能识别。
用gocr能够正确识别的最好情况是能够正确识别4个数字中的3个。
看来在没有对图片作预处理之前,这种识别方式基本不可行。
还没有开始就已经结束了。
纸张在许多地方已日益失宠,无纸化办公谈论40多年,办公环境正限制纸山的生成。而过去几年,无纸化办公的概念发生了显着的转变。在计算机软件的帮助 下,包含大量重要管理数据和资讯的文档可以更方便的以电子形式储存。扫描文档的好处不纯粹是存档理由。为了访问基于纸张的信息和将信息整合进数字工作流, 光学字符识别(OCR)技术至关重要。选择正确的OCR工具要基于特定需求而定,例如在线OCR服务对某些人有用,但可能存在隐私问题和文件大小限制。 OCR软件非大众产品,因此开源替代相对于商业级重量级产品相对较少,再加上OCR软件需要先进的算法将扫描的图像正确翻译成实际的文字,而图像不仅仅含 有文字,它还包含布局、图形和表格,可能会跨越多页。
优秀的开源OCR软件包括:
Tesseract
原本由惠普开发的图像识别类库tesseract-ocr已经更新到2.04, 就是最近Google支持的那个OCR。原先是惠普写的,现在Open source了。
OCRopus
Ocropus的(TM)是一个先进的文件分析和OCR系统,采用可插入的布局分析,可插入的字符识别,自然语言统计建模和多语言支持功能。
Cuneiform
Cuneiform 是一个 OCR 文字识别系统的商标,最开始是由Cognitive 技术所开发的运行在 Windows 下的软件。而这个项目是该软件在 Linux 系统下的移植版本。
GOCR
GOCR 是一个开源的OCR光学识别程序。
OCRFeeder
OCRFeeder 是 GNOME 桌面下的一个开源 OCR 套件。可将纸质或者图形文档转成电子文档。
Lios
linux-intelligent-ocr-solution (Lios) 是Linux下一个开源的 OCR 解决方案,可将打印的文档转成可编辑的文本。
- 开源ocr库
- 开源OCR引擎Tesseract-OCR
- 开源OCR引擎Tesseract-OCR简介
- 4 Tesseract-ocr 系列 : 开源OCR比较
- 开源OCR引擎Tesseract
- 开源OCR引擎Tesseract
- 开源OCR引擎Tesseract
- 开源OCR引擎Tesseract
- Android OCR识别库
- Tess-OCR训练库
- OCR
- OCR
- OCR
- OCR
- OCR
- OCR
- OCR
- 如何通过Tesseract开源OCR引擎创建Android OCR应用
- 程序员编程艺术第三十四~三十五章:格子取数问题,完美洗牌算法
- proc_dir_entry结构说明
- android studio的安装
- 腾讯2012 笔试题-----A、B两人玩猜字游戏
- 改善C++ 程序的150个建议学习之建议8:拒绝晦涩难懂的函数指针
- 开源ocr库
- iOS 常用的三种动画表现效果
- SQLite学习实例, 日记本
- MonkeyRunner之手机屏幕截图的比对
- Visualize your shell history
- 用recommenderlab做电影推荐
- VBA 从一个excel读取特定行,列到指定excel
- Arrays类操作数组
- <mvc:annotation-driven />