java word相关——一个菜鸡的学习过程

来源:互联网 发布:视频背景音乐提取软件 编辑:程序博客网 时间:2024/06/05 20:45

一个菜鸡记录给自己看的

java的主要有两种方法
1、使用POI,这样的包,直接的是根据office文件的相应规则,进行解析封装
2、使用jcob这样的,通过调用office的dll文件,操作

第一种优点:
不需要在环境上安装office,纯java环境,开发文档较全,使用方便
缺点:
对于office的某些功能,特性兼容不是很全面,但一般的内容也可以满足

第二种优点:
对于office文件的兼容性良好,和使用word,excel的操作基本上是一样的
缺点:
由于是通过java调用office来完成,所以需要在环境上安装office,文档较少
这个是poi的读取word方法
可以读取 但是表格内的无法显示
package word;    import java.io.File;import java.io.FileInputStream;import java.io.InputStream;import org.apache.poi.POIXMLDocument;import org.apache.poi.POIXMLTextExtractor;import org.apache.poi.hwpf.extractor.WordExtractor;import org.apache.poi.openxml4j.opc.OPCPackage;import org.apache.poi.xwpf.extractor.XWPFWordExtractor;public class Try {    public static void main(String[] args) {        try {            InputStream is = new FileInputStream(new File("testdoc.doc"));            WordExtractor ex = new WordExtractor(is);            String text2003 = ex.getText();            System.out.println(text2003);            OPCPackage opcPackage = POIXMLDocument.openPackage("2007.docx");            POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);            String text2007 = extractor.getText();            System.out.println(text2007);                    } catch (Exception e) {            e.printStackTrace();        }    }}




0 0
原创粉丝点击