Tess4J OCR简单使用教程
来源:互联网 发布:win10笔记本电脑优化 编辑:程序博客网 时间:2024/06/05 15:18
Tess4J简介
Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。而Tess4J则是Tesseract在Java PC上的应用。在英文和数字识别中性能还是不错的,但是在中文识别中,无论速度还是识别率还是较弱,建议有条件的话,针对场景进行训练,会获得较好结果,本文仅对目前Tess4J的用法进行介绍。
使用教程
1.去Tess4J官网下载源码包
前往:Tess4J 官网下载最新的Tess4J的源码包,其中包含Java代码,jar,dll等,大概结构如下:
2.创建Java项目并配置
网上不少文章会提到DLL,其实在最新的版本,如果源码包里面有dist路径,则只需要配置该jar包和lib中相关的jar即可。
注意点1:将dist/tess4j-3.4.0.jar 及 lib/*.jar加入项目
注意点2:tessdata一定要配置到根目录,否则需要在代码中指定dataPath
ITesseract instance = new Tesseract();instance.setDatapath("the absolute path of tessdata");
注意点3:无需将源码包拷贝到项目中,可能会出错
所以最终的目录结构如下:
3.尝试写一个Demo
可以按照官网的示例,直接编写一个Demo试一下效果:
public class OCRDemo { public static void main(String[] args) throws TesseractException { ITesseract instance = new Tesseract(); //如果未将tessdata放在根目录下需要指定绝对路径 //instance.setDatapath("the absolute path of tessdata"); // 我们需要指定识别语种 instance.setLanguage("chi_sim"); // 指定识别图片 File imgDir = new File("test_chinese_07.PNG"); long startTime = System.currentTimeMillis(); String ocrResult = instance.doOCR(imgDir); // 输出识别结果 System.out.println("OCR Result: \n" + ocrResult + "\n 耗时:" + (System.currentTimeMillis() - startTime) + "ms"); }}
其中注意三处:
- 1. tessdata放在与src同级的根目录下,否则需要指定dataPath
- 2. 如果需要识别英文之外的语种,需要指定识别语种;
- 3. 其他语种下载地址:其他语种下载地址
附录:
CSDN下载地址.
阅读全文
2 0
- Tess4J OCR简单使用教程
- Java OCR(使用Tess4J)
- tess4j正确的使用 OCR
- debian8 上安装tesseract-ocr并使用Tess4j
- 使用jTessBoxEditorFX训练Tesseract-OCR 简单教程
- linux系统如何使用tess4j(java)进行ocr图片文字识别
- OCR图像识别技术的JAVA实现(二)之Tess4J的使用
- Java OCR文字识别(Tess4J)
- Tess4J使用(A)
- JavaOcr之Tess4j简单示例
- Java OCR tess4j 图片识别技术(三)
- LEADTOOLS使用教程:创建OCR引擎实例
- Tesseract-OCR的简单使用与训练
- Tesseract-OCR的简单使用与训练
- Tesseract-OCR的简单使用与训练
- Tesseract-OCR的简单使用与训练
- Java使用Tess4J 进行图片文字识别
- Java使用Tess4J 进行图片文字识别
- 如何重启DevStack所有服务
- Android studio默认安装路径在哪里?
- php学习心得(二)
- 对象的notify()和notifyAll()区别
- 数据结构(四)排序算法(一)冒泡,插入,希尔排序
- Tess4J OCR简单使用教程
- 在windows10上安装ubuntu并搭建java运行环境
- 代理设计模式之静态代理与动态代理(超..)详解
- nodejs express服务器搭建和使用教程
- 【es6】symbol
- 七牛云存储的 Javascript Web 前端文件上传
- 模拟题 动态规划
- POJ1915BFS
- shell内置测试判断