用Java简单的读取word文档中的数据
来源:互联网 发布:python 自动化运维教程 编辑:程序博客网 时间:2024/05/14 14:04
第一步:下载tm-extractors-0.4.jar
下载地址:[url]http://drc-dev.ohiolink.edu/browser/elated-core/trunk/lib/tm-extractors-0.4.jar?rev=46[/url] 并把它放到你的classpath路径下面。
第二步:简单的程序.(WordReader .java)
前提是你的E盘下有个Strust.doc文件。
import java.io.File;
import java.io.FileInputStream;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {
public static String readDoc(String doc) throws Exception {
// 创建输入流读取doc文件
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对doc文件进行提取
text = extractor.extractText(in);
return text;
}
public static String readDoc(String doc) throws Exception {
// 创建输入流读取doc文件
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对doc文件进行提取
text = extractor.extractText(in);
return text;
}
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
try{
String text = WordReader.readDoc("E:/Strust.doc");
System.out.println(text);
}catch(Exception ex){
ex.printStackTrace();
}
}
}
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
try{
String text = WordReader.readDoc("E:/Strust.doc");
System.out.println(text);
}catch(Exception ex){
ex.printStackTrace();
}
}
}
这样就简单的完成了从word中读取数据了。你可以把它生成一个txt的文件。
- 用Java简单的读取word文档中的数据
- 用Java读取word中的数据
- 用Java读取word中的数据
- Java读取word文档
- java读取word文档
- Java读取word文档
- java读取word文档
- 用Java简单的读取pdf文件中的数据
- 用Java简单的读取pdf文件中的数据
- 用Java简单的读取pdf文件中的数据:
- 读取word文档中的表格数据到access数据库
- Java用poi读取Word文档
- 关于用java编写生成word文档,动态添加数据到word文档的一些心得
- POI3.8读取word文档的表格数据!
- 简单的java读取excel表中的数据代码
- 用GridView读取XML文档中的数据
- C# 读取word文档数据粘贴全部
- 网上找来的用java读取word文档的代码
- 如何使用flex皮肤
- 如何给别人介绍一个你做过的项目
- csdn的程序人生正式开始!
- UrlRewriter技术简单运用
- a的href中使用window.open()方法
- 用Java简单的读取word文档中的数据
- 现场工作的“七种浪费”
- 用Java简单的读取pdf文件中的数据
- SQL 中DROP,DELETE和TRUNCATE心的
- Java设计模式:单态模式,工厂模式,代理模式,观察者模式示例
- C# 转换 ISO-8859-1 编码
- JSF和Struts的区别概述
- Flash3D
- Windows/Linux下C/C++内存泄露检测工具