ORC工具解析图片文字
来源:互联网 发布:win32编程 编辑:程序博客网 时间:2024/04/30 08:47
看到好多人使用ORC解析图片,感觉准确率不是很高,但是网上都讲的比较复杂,我的理解就是两步。
安装工具、调用工具
1.解析工具下载
里面包含 ORC3.0安装包以及中文库,另附带两个jar包用于图形处理,此工具为绿色版
http://download.csdn.net/detail/xiekuntarena/9659084
安装完毕之后,需要将中文库chi_sim.traineddata复制到tessdata文件夹下
2.CMD命令实现调用
解析的图片与放置的路径如下图:
需解析的图片已放置在ORC目录下
CMD执行:D:/Tesseract-OCR/tesseract D:/Tesseract-OCR/3.PNG D:/Tesseract-OCR/3 -l chi_sim
第一个参数:tesseract为ORC的执行exe
第二个参数:图片的路径
第三个参数:生成结果的文件地址,默认格式为.txt
第四个参数:-l (L) chi_sim 表示使用中文库解析
3.JAVA代码实现
package testcase;import java.io.IOException;public class TestCase { public static void main(String[] args) { try { String strCmd = "D:/Tesseract-OCR/3.PNG " + "D:/Tesseract-OCR/3 "+ "-l chi_sim"; System.out.println(strCmd); Runtime.getRuntime().exec(strCmd); } catch (IOException e) { e.printStackTrace(); } }}
执行结果如下图:
可看出,关注–》关汪 解析的不准确
可通过对图片进行拉伸、翻转、缩放、明暗、灰度,将每一种图片进行解析并得出结果,取多次解析结果进行分析。具体怎么做,大家可以研究研究。
1 0
- ORC工具解析图片文字
- 使用ORC识别图片的文字
- java ORC 图片中文识别
- orc
- 图片解析工具类
- Winform水印工具(文字和图片皆可)
- 生成带有文字图片的工具
- HTML5 文字及图片标签解析
- 获取json解析 图片,文字+MyAsyncTask+ImagerLoader
- java 二维码 生成和解析 (中间:图片、文字;底部:文字)
- js图片解析工具类
- 工具类解析gson 图片
- 图片工具类, 图片水印,文字水印,缩放,补白等
- 比较好用的图片文字转文本工具
- Apache POI 解析 microsoft word 图片文字都不放过
- Apache POI 解析 microsoft word 图片文字都不放过
- Apache POI 解析 microsoft word 图片文字都不放过
- [Android] Json格式解析和文字图片传输
- 【fiddler】使用过程中总是弹出提示框“Protocol violation Report”
- C运算符优先级
- BIO与NIO、AIO的区别(这个容易理解)
- cookie session
- Android 计算日期差
- ORC工具解析图片文字
- 基于menge的人群仿真技术开发(初级)
- ReactNative iOS源码解析(一)
- 关于波特率与字节传输速率计算
- weblogic 启动缓慢问题的解决
- @PathVariable映射URL绑定的占位符
- Kelly First
- 4-2 电子时钟中的运算符重载
- 3.4自定义控件的那些事儿~