JavaOcr之Tess4j简单示例

来源:互联网 发布:淘宝培训班多少钱 编辑:程序博客网 时间:2024/06/10 23:35

依赖包:

<dependency>      <groupId>net.sourceforge.tess4j</groupId>      <artifactId>tess4j</artifactId>      <version>2.0.1</version>      <exclusions>          <exclusion>              <groupId>com.sun.jna</groupId>              <artifactId>jna</artifactId>          </exclusion>      </exclusions></dependency>

下载相关的语言包:
https://github.com/tesseract-ocr/tessdata (验证码识别相关的语言包)
如只想识别一般的英文、数字验证码,下载eng.traineddata,放到项目下tesseract文件夹下。

示例代码

@Testpublic void testIdentify() {    String identifyCodePath = "image/image.png";    // 解析验证码    File imageFile = new File(identifyCodePath);    Tesseract tessreact = new Tesseract();    tessreact.setDatapath("tessreact");// 语言包路径    String result = null;    try {        result = tessreact.doOCR(imageFile);    } catch (TesseractException e) {        e.printStackTrace();    }    System.out.println(result);    Assert.assertEquals("hmxo", result.trim());}
0 0
原创粉丝点击