Tess4j的使用(识别中文)
来源:互联网 发布:海口整站优化 编辑:程序博客网 时间:2024/05/16 19:19
最近做了一个验证码识别的项目,需要用到OCR,来来回回整了几个小时,终于弄好了。
首先下载tess4j:http://tess4j.sourceforge.net/
根据官方教程,tess4j的包解压后,将以下.jar包复制到lib项目文件夹,然后再Build Path(如图)。
再把tessdata文件夹拷贝到项目根目录下
如要支持中文,请下载中文字库chi_sim.traineddata,放到tessdata目录下,然后在代码里面添加该字库
instance.setLanguage("chi_sim");
接着在src下建一个类,将一下官方的示例代码拷贝进去即可成功。(附源码)
package tess4j.clan;import java.io.File; import net.sourceforge.tess4j.*; public class TesseractExample { public static void main(String[] args) { File imageFile = new File("jietu.png"); ITesseract instance = new Tesseract(); // JNA Interface Mapping // ITesseract instance = new Tesseract1(); // JNA Direct Mapping instance.setLanguage("chi_sim");//添加中文字库 try { String result = instance.doOCR(imageFile); System.out.println(result); } catch (TesseractException e) { System.err.println(e.getMessage()); } } }
运行结果:
精度不是很高。有高需求的读者可以去训练字库。再导入即可
0 0
- Tess4j的使用(识别中文)
- Java中使用tess4J进行图片文字识别(支持中文)
- OCR图像识别技术的JAVA实现(二)之Tess4J的使用
- Tess4J使用(A)
- Tess4j+中文识别+使用介绍文档+参考网址+实现源码下载地址
- Java使用Tess4J 进行图片文字识别
- Java使用Tess4J 进行图片文字识别
- JAVA使用Tess4j识别图片内容
- java使用Tess4j 识别图片文字
- 关于Tesseract OCR 中文训练识别小试(java调用Tess4j)
- tess4j正确的使用 OCR
- 验证码识别(Tess4J初体验)
- 验证码识别(Tess4J初体验)
- 验证码识别(Tess4J初体验)
- Java OCR文字识别(Tess4J)
- linux系统如何使用tess4j(java)进行ocr图片文字识别
- tess4j做图像识别
- Tess4J图片文字识别
- int 和 nsinterger的区别
- 【SHOI 2002】百事世界杯之旅 概率期望
- (区别)递归与迭代&&递归与递推&&迭代与递推
- 请问
- Maven学习 (一) 搭建Maven环境
- Tess4j的使用(识别中文)
- linux命令大全之diff命令详解(比较文件内容)
- 如何使用强大的PHP函数对数组进行排序
- java责任链模式
- Java 中的可变参数(Varargs)
- 一种分布式session实现方案
- Electron开发入门(五):项目打包
- 【BZOJ3112】[ZJOI2013]防守战线
- 【Leetcode】301. Remove Invalid Parentheses 移除非法小括号