deep_ocr 是使得 OCR 比 tesseract 更好的中文识别、身份证识别等等
来源:互联网 发布:小卡机器人编程参数 编辑:程序博客网 时间:2024/06/05 01:19
deep ocr
估计很多开发员使用tesseract做中文识别,但是结果不是一般的差,譬如下面的图片
$ tesseract -l chi_sim test_data.png out_test_data
看到恨多公司在招腭大改癫和机器字习胸人 v 我有3个建议 (T) 忧T ' 2个上t较靠遭胸人就譬了 v不是越多越好 (2) 这T '2个人要能给大蒙上踝'倩邂知L目 (3) 不要招不宣代四胸人:虹大改癫和机器字习胸v不裹目宣 (或者宣过) 大量代四v基本上就只会忽悠了
其实现在做文字识别不是很难,特别基于深度学习,这里是这个项目的reco_chars.py脚本,基于caffe的识别效果,是不是好很多?而且代码比tesseract短很多。
$ python reco_chars.py
看很多公苘在招聘天数据和机器学习人我有个建议找个较靠谱的人就够了不是越多越好这个人要给大家上课传递知识不要招不写代码的人做天数据机器学习的不亲写或者写过天且代码基本上就只会忽悠了
大家可以基于caffe训练自己的字体,系统基于这个文章开发单个字的识别:
Deep Convolutional Network for Handwritten Chinese Character Recognitionhttp://cs231n.stanford.edu/reports/zyh_project.pdf
通过 Docker 安装
先安装docker,以下教程在Ubuntu 14.04 通过测试
https://www.docker.com/
下载deep_ocr_workspace.zip (https://pan.baidu.com/s/1nvz2wrB 和 https://pan.baidu.com/s/1qYPKH3Y )
两个文件的md5sum值,用于校验文件是否成功下载。
$ md5sum deep_ocr_workspace.zipffeda7ea6604e7b8835c05a33fa0459e deep_ocr_workspace.zip$ md5sum deep_ocr_workspace.z01ea66796c2bbdb2bec9b7ee28eb44012d deep_ocr_workspace.z01
解压到本地硬盘,譬如到以下地方 (~/deep_ocr_workspace)
cat deep_ocr_workspace.z* > unsplit_deep_ocr_workspace.zipunzip unsplit_deep_ocr_workspace.zip -d ~/
这个zip包含deep_ocr所有需要数据文件(由于太大了,所以放百度云了)。所有数据到解压到 ~/deep_ocr_workspace
,你也可以把需要处理的数据放到这个文件夹。
基于cpu
docker pull jinpengli/deep_ocr_cpu_docker:latest
启动 docker container
docker run -ti --volume=${HOME}/deep_ocr_workspace:/workspace jinpengli/deep_ocr_cpu_docker:latest /bin/bashcd /opt/deep_ocrgit pull origin master
volume用于mount到container里面,这样可以获取上面的识别结果。
python /opt/deep_ocr/reco_chars.py
然后可以继续你们的开发。。。。加油。。。
身份证识别
暂时不是很稳定,需要加一些语义模型。等等吧。。。。
识别图片
执行命令
export WORKSPACE=/workspacedeep_ocr_id_card_reco --img $DEEP_OCR_ROOT/data/id_card_img.jpg --debug_path /tmp/debug --cls_sim ${WORKSPACE}/data/chongdata_caffe_cn_sim_digits_64_64 --cls_ua ${WORKSPACE}/data/chongdata_train_ualpha_digits_64_64
识别结果:
...ocr res:============================================================name韦小宝============================================================address北京市东城区累山前街4号紫禁城敬事房============================================================month12============================================================minzu汉============================================================year1654============================================================sex男============================================================id1X21441114X221243X============================================================day20
阅读全文
0 0
- deep_ocr 是使得 OCR 比 tesseract 更好的中文识别、身份证识别等等
- 【Tesseract-OCR】玩转OCR中文识别
- 使用Tesseract-OCR识别图片上的中文
- tesseract-ocr 识别中文扫描图片
- Java中文图像识别tesseract-ocr || tif
- OCR tesseract中文无法识别问题
- tesseract-ocr识别中文与字库训练
- 使用谷歌开源组件tesseract-OCR识别身份证(windows版本)
- tesseract-ocr识别字符
- tesseract-ocr图片识别
- Tesseract OCR识别小结
- Tesseract ocr文字识别
- 手机身份证识别OCR识别
- android ocr 身份证识别
- tesseract-ocr识别中文扫描图片实例讲解
- tesseract-ocr识别中文扫描图片实例讲解 .
- tesseract-ocr识别中文扫描图片实例讲解
- tesseract-ocr识别中文扫描图片实例讲解
- 错误提示:java.lang.StackOverflowError
- 360极速浏览器显示https证书无效解决方法
- HDU6035 Colorful Tree(dfs继承思想,虚树怎么写??)
- C++语言
- 【整理】产品相关的一些英文简称
- deep_ocr 是使得 OCR 比 tesseract 更好的中文识别、身份证识别等等
- Python_6
- 常用vi命令
- HTTP状态码
- Hadoop学习之MapReduce框架详解
- 字典树(基础学习)
- SY全局系统字段
- 字符集
- AR 广告大屏视频播放模块