python图片文本识别的简单实现
来源:互联网 发布:mysql limit 编辑:程序博客网 时间:2024/05/19 23:28
http://blog.sina.com.cn/s/blog_628cc2b70101cjvp.html
python图片文本识别使用的工具是PIL和pytesser。因为他们使用到很多的python库文件,为了避免一个个工具的安装,建议使用pythonxy,这个工具的介绍可参考baidu。
tesseract是谷歌的一个对图片进行识别的开源框架,免费使用,现在已经支持中文,而且识别率非常高,这里简要来个helloworld级别的认识
下载地址:http://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-ocr-setup-3.01-1.exe&can=2&q=
下载之后进行安装,不再演示。
在tesseract目录下,有个tesseract.exe文件,主要调用这个执行文件,用cmd运行到这个目录下,在这个目录下同时放置一张需要识别的图片,这里是123.jpg
然后运行:tesseract 123.jpg result
会把123.jpg自动识别并转换为txt文件到result.txt
但是此时中文识别不好,要下载一个中文包:http://code.google.com/p/tesseract-ocr/downloads/detail?name=chi_sim.traineddata.gz&can=2&q=
然后找到tessdata目录,把eng.traineddata替换为chi_sim.traineddata,并且把chi_sim.traineddata重命名为eng.traineddata
ok,现在中文识别基本达到90%以上了
- python图片文本识别的简单实现
- python图片文本识别的简单实现
- 【Python】Python简单的图片识别
- python之图片文本识别
- python 实现简单的文本聚类
- 简单的图片浏览器和手势识别的功能实现
- 简单的实现爬虫爬取网页文本和图片
- python实现简单的图片隐写术
- Python 实现简单的网络抓取图片
- Python实现一个简单的图片爬虫
- Python + OpenCV 实现简单的人脸识别
- 简单的文本相似性测量(Python实现)
- python抓取知乎首页文本信息的简单实现
- 用python实现简单的文本情感分析
- Python利用Face++实现身份证件图片识别
- Python实现图片滑动式验证识别
- Java图片文本识别工具Eye实现(不支持中文)
- PYTHON实现简单写文本日志
- Openwrt读取所连接的终端设备和IPV6的方法
- HBase 常用Shell命令
- forward和redirect的区别
- linux sudo使用和sudoers配置详解
- PHP在字符串中查找指定字符串并删除的代码
- python图片文本识别的简单实现
- 简单java定时任务,(仅供参考)
- 作为一个4年程序员至少需要掌握的专业技能
- Realm简单使用
- genymotion的 INSTALL_FAILED_CPU_ABI_INCOMPATIBLE
- oracle-函数
- JAVA_深入理解HashMap
- Android编译示例代码
- fzu2150 搜索