Java OCR tesseract 图片识别技术(二)
来源:互联网 发布:java zookeeper 使用 编辑:程序博客网 时间:2024/06/05 05:01
一、前面已经测试过了tesseract的dos方式调用,接下来使用java代码方式调用tesseract工具识别验证码。
package com.cyn.utils;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.IOException;public class OCRUtil { //OCR的都是命令方式调用 public static String getImgText(String imgPath) { String result = ""; BufferedReader br = null; //中文识别 -l chi_sim -psm 7 nobatch String ocrLangData="outputbase nobatch digits";//识别语言 String outPath = imgPath.substring(0, imgPath.lastIndexOf(".")); File file = new File(outPath + ".txt"); try { //dos执行 Runtime runtime = Runtime.getRuntime(); String command = "tesseract " + imgPath + " " + outPath +" "+ ocrLangData; Process ps = runtime.exec(command); ps.waitFor(); // 读取文件 br = new BufferedReader(new FileReader(file)); String temp = ""; StringBuffer sb = new StringBuffer(); while ((temp = br.readLine()) != null) { sb.append(temp); } // 文字识别结果 result = sb.toString(); } catch (Exception e) { System.out.println("识别图片异常!"); e.printStackTrace(); }finally{ try { br.close(); //读取完后删除文件 file.delete(); } catch (IOException e) { e.printStackTrace(); } } return result; } //测试 public static void main(String[] args) { getImgTxtList("E:\\TestCode"); } //处理一个文件夹中的所有验证码 public static void getImgTxtList(String filepath){ File file = new File(filepath); File [] fileList = file.listFiles(); for(File f:fileList){ String imgpath=f.getAbsolutePath(); if(imgpath.endsWith("jpg")||imgpath.endsWith("png")||imgpath.endsWith("bmp")){ String resultTxt = getImgText(imgpath); System.out.println("result: "+resultTxt); } } }
上面的代码作用是将E:\TestCode文件夹下的所有图片文件加以识别。在java代码中调用dos命令使用tesseract工具。
阅读全文
0 0
- Java OCR tesseract 图片识别技术(二)
- Java OCR tesseract 图片识别技术(一)
- Java OCR tesseract 图像智能字符识别技术 Java代码实现(二)
- tesseract-ocr图片识别
- Java OCR tesseract 图像智能字符识别技术(一)
- java 调用tesseract-ocr识别图片
- JAVA识别身份证号码,H5识别身份证号码,tesseract-ocr识别(二)
- Tesseract-OCR 字符识别技术
- Tesseract-ocr-图片文字识别
- Java OCR tesseract 图像智能字符识别技术
- Java OCR tesseract 图像智能字符识别技术
- Java OCR tesseract 图像智能字符识别技术
- Java OCR tesseract 图像智能字符识别技术
- java 利用 tesseract-ocr 进行文字识别技术
- Java OCR tesseract 图像智能字符识别技术
- java 利用Tesseract-OCR识别图片验证码
- java程序集成Tesseract-OCR识别图片信息
- OpenCV+Tesseract进行OCR学习(二)文字识别
- SQL Server 2008 R2中 某XX数据库 的事务日志已满 请参阅 sys.databases 中的 log_reuse_wait_desc 列
- Wireshark+LoadRunner 测试APP性能
- Spring Security之Config模块详解(TODO)
- 计划经济和市场经济·《厚黑学全书》
- 【Linux环境Ubuntu16.04安装F.lux】
- Java OCR tesseract 图片识别技术(二)
- ES6学习之路(四) 数组拓展
- linux网络编程中阻塞和非阻塞socket的区别
- Spring定时任务的几种实现
- 安卓HTML中打开一个连接!点击跳转了,可以实现返回上一级的HTML的页面!
- tensorflow学习之路(4):tf.shape(xxx) vs. xxx.get_shape()
- 产品运营必看!这6本书你不该错过!
- CString截取字符串
- ISS 上传大小限制