记录将文档word2007版本转换为html格式——java代码
来源:互联网 发布:分水岭算法的原理 编辑:程序博客网 时间:2024/06/14 14:22
public static void docxToHtml() throws Exception {
String sourceFileName = "D:/work/实验室管理测试20170306.docx";
String targetFileName = "D:/work/HTML_Work.html";
String imagePathStr = "D:/";
OutputStreamWriter outputStreamWriter = null;
XWPFDocument document = null;
try {
File file =new File(sourceFileName);
InputStream is = new FileInputStream(file);
document = new XWPFDocument(is);
XHTMLOptions options = XHTMLOptions.create();
// 存放图片的文件夹
options.setExtractor(new FileImageExtractor(new File(imagePathStr)));
// html中图片的路径
options.URIResolver(new BasicURIResolver("image"));
outputStreamWriter = new OutputStreamWriter(new FileOutputStream(targetFileName), "utf-8");
XHTMLConverter xhtmlConverter = (XHTMLConverter) XHTMLConverter.getInstance();
xhtmlConverter.convert(document, outputStreamWriter, options);
outputStreamWriter.close();
} catch (Exception e) {
e.printStackTrace();
}
String sourceFileName = "D:/work/实验室管理测试20170306.docx";
String targetFileName = "D:/work/HTML_Work.html";
String imagePathStr = "D:/";
OutputStreamWriter outputStreamWriter = null;
XWPFDocument document = null;
try {
File file =new File(sourceFileName);
InputStream is = new FileInputStream(file);
document = new XWPFDocument(is);
XHTMLOptions options = XHTMLOptions.create();
// 存放图片的文件夹
options.setExtractor(new FileImageExtractor(new File(imagePathStr)));
// html中图片的路径
options.URIResolver(new BasicURIResolver("image"));
outputStreamWriter = new OutputStreamWriter(new FileOutputStream(targetFileName), "utf-8");
XHTMLConverter xhtmlConverter = (XHTMLConverter) XHTMLConverter.getInstance();
xhtmlConverter.convert(document, outputStreamWriter, options);
outputStreamWriter.close();
} catch (Exception e) {
e.printStackTrace();
}
}
注意: File file =new File(sourceFileName); 不可以拉下;否则出错
导包: dom4j-1.6.1.jar、junit-3.8.1.jar、log4j-1.2.13.jar、
poi-3.8-20120326.jar、poi-examples-3.8-20120326.jar
poi-excelant-3.8-20120326.jar、poi-ooxml-3.8-20120326.jar
poi-ooxml-schemas-1.1-20120326.jar (注 1.1.0版本)(自己做期间此处出错,版本不对会出现 Package should contain a content type part [M1.13]错误)
poi-scratchpad-3.8-20120326.jar、stax-api-1.0.1.jar
xmlbeans-2.3.0.jar
阅读全文
0 0
- 记录将文档word2007版本转换为html格式——java代码
- 使用java将word文档转换为swf格式
- 将Rtf转换为Html格式
- C# 将Word文档转换为HTML
- C# 将Word文档转换为HTML
- poi 将excel转换为html的java代码
- [唐胡璐] - C#将QTP结果(XML+XSL文档)转换为HTML格式
- 将word文档转化为html(代码)
- 将Word文档转化为HTML格式的文档
- 将Word文档转化为HTML格式的文档
- 将Word文档转化为HTML格式的文档
- 将Word文档转化为HTML格式的文档
- 将Word文档转化为HTML格式的文档
- 将Word文档转化为HTML格式的文档
- 将Word文档转化为HTML格式的文档
- 将Word文档转化为HTML格式的文档
- 将Word文档转化为HTML格式的文档
- 将Word文档转化为HTML格式的文档
- spring学习之@ModelAttribute运用详解
- HDU
- Java异常打印输出中常见方法的分析
- 正则表达式
- 原生javascript判断是否是移动端访问,跳转到手机端网址代码
- 记录将文档word2007版本转换为html格式——java代码
- Python爬虫爬取知乎用户信息+寻找潜在客户
- 字符串
- 腾讯开源ncnn:自己的模型运行结果与caffe的结果不一样
- 对象的访问定位:句柄与直接指针
- MVC引入SERVICE层 提高代码重用性 沟通CONTROL和MODEL
- HttpClient源码解析系列:第三篇:发送-接收的底层过程
- hbase cannot get log reader问题
- LeetCode-9.Palindrome Number(求回文数字)