java word doc转xml 解析word里面的树
来源:互联网 发布:unity3d麻将开发思路 编辑:程序博客网 时间:2024/06/05 04:22
最近做的一个项目遇到一个需要将word里面画的一个树导入到数据库,于是就想用doc 转成xml,然后再解析到数据库里面。word里面的树是这样的:
转成xml后有了一下关系结构:
<o:relationtable v:ext="edit"><o:rel v:ext="edit" idsrc="#_s1028" iddest="#_s1028"/><o:rel v:ext="edit" idsrc="#_s1029" iddest="#_s1028" idcntr="#_s1032"/><o:rel v:ext="edit" idsrc="#_s1030" iddest="#_s1028" idcntr="#_s1033"/><o:rel v:ext="edit" idsrc="#_s1117" iddest="#_s1028" idcntr="#_s1118"/><o:rel v:ext="edit" idsrc="#_s1161" iddest="#_s1028" idcntr="#_s1162"/></o:relationtable>
格式转换找了网上好多方法都不好用,最后看到一个用word录制宏,然后用jacob调用宏的方法来实现批量转换。
宏代码:
Sub hong1()'' hong1 宏'' Dim name As String name = "01" For i = 1 To 4 ChangeFileOpenDirectory "D:\doc\" Documents.Open filename:=name & ".doc", ConfirmConversions:=False, ReadOnly:= _ False, AddToRecentFiles:=False, PasswordDocument:="", PasswordTemplate:= _ "", Revert:=False, WritePasswordDocument:="", WritePasswordTemplate:="", _ Format:=wdOpenFormatAuto, XMLTransform:="" ChangeFileOpenDirectory "D:\doc2xml\" ActiveDocument.SaveAs2 filename:=name & ".xml", FileFormat:=wdFormatFlatXML, _ LockComments:=False, password:="", AddToRecentFiles:=True, WritePassword _ :="", ReadOnlyRecommended:=False, EmbedTrueTypeFonts:=False, _ SaveNativePictureFormat:=False, SaveFormsData:=False, SaveAsAOCELetter:= _ False, CompatibilityMode:=11 ActiveWindow.Close name = name + 1 If name < 10 Then name = "0" & name Next iEnd Sub
调用宏的java代码:
static void runMacros(String path) { ActiveXComponent word = new ActiveXComponent("Word.Application"); Dispatch documents = word.getProperty("Documents").toDispatch(); //String filename = "01.doc"; File file = new File(path); File[] files = file.listFiles(); for (File tf : files) { Dispatch document = Dispatch.call(documents, "Open", tf.getAbsolutePath()).toDispatch(); Dispatch.call(word, "Run", new Variant("macro1"), new Variant(path), new Variant(tf.getName()), new Variant(path), new Variant(tf.getName().substring(0,tf.getName().lastIndexOf(".")))); } // Dispatch.call(documents, "Close"); }
实现转换之后再用dom4j来解析xml树。基本搞定了。
1 0
- java word doc转xml 解析word里面的树
- pdf 转 doc(Word)的方法
- php解析doc格式word文件的另一种方法
- 【word | html】word(doc | docx) 转 html
- 解析XML---word
- apache poi解析word(doc)文档成xml及导出成html
- apache poi解析word(doc)文档成xml及导出成html
- 转:JAVA实现word doc docx pdf excel的在线浏览
- Java抽取word里面文本
- Java将数据写入word文档(.doc)
- java解析word文档
- Java解析 WORD
- java导出word(2003版doc格式) FreeMarker+XML实现
- 去掉WORD里面的画布
- 发送邮件带word附件的.doc
- 使用Java的POI进行Word文档的解析并生成XML格式文档
- java用jacob批量word转xml
- POI Word DOC格式转Html
- 阿里云Linux服务器安装配置ftp及上传网站全教程
- java的IO技术中什么是I什么是O?
- 第六周 连通分量
- 最大长方体问题
- ubuntu 16.4开启ssh服务
- java word doc转xml 解析word里面的树
- Java HashMap 判断 Key 相等
- python idle 清屏问题的解决
- LeetCode之Hamming Distance
- 全排列问题
- java的IO技术有什么用?
- Java文件流应用:复制文件
- hdu5971——Wrestling Match(以二分图判定为主要思路的多种搞法)
- linux下使用java编写redis测试案例