清理由Word导出的HTML文档的JS脚本
来源:互联网 发布:ios10软件源大全 编辑:程序博客网 时间:2024/05/25 13:33
当把一个Word文档导出成HTML格式时,会发现到处的文件之中会有很多样式,结果使得文件很大。下面的这个脚本可以清理其中的样式信息,只保留数据信息。
使用方法:
把<script src="ParseHtml.js" language="javascript"></script>放到html文件的<head>中,然后打开文件,会看到在页面的最下面多出了一个按钮。点击,弹出一个新的页面,并提示保存文件。保存即可。
说明:因为时间比较仓卒,所以可能会有一些错误,请大家帮忙指正。
//<script src="ParseHtml.js" language="javascript"></script>function Parse(root){ var html=""; var tag; var value; for(var i=0;i<root.childNodes.length;i++) { if(root.childNodes[i].id=="QLSC_MUMU_ButtonParse") continue; tag=root.childNodes[i].tagName; value=root.childNodes[i].nodeValue; if((tag+"").toLowerCase()=="font") html+=Parse(root.childNodes[i]); if(tag+""=="undefined") html+=value; else { if(root.childNodes[i].childNodes.length>0) { html+="<"+tag+">"; if(value!=null) html+=value; html+=Parse(root.childNodes[i]); html+="</"+tag+">"; } else { html+="<"+tag+">"; if(value!=null) { if(value!=null) { html+=value; html+="</"+tag+">"; } } else { tmp=(tag+"").toLowerCase(); if(tmp=="script"||tmp=="title"||tmp=="link"||tmp=="meta"||tmp=="style") html+="</"+tag+">"; } } } } return html;}
function Start(){ var ret=Parse(document.documentElement); var wnd=window.open("","mumu","addressbar=no,toolbar=yes,scrollbars=yes,resizable=yes",true); wnd.document.write("<html>"+ret+"</html>"); wnd.document.close(); wnd.document.execCommand('SaveAs');}function Init(){ var body=document.getElementsByTagName("body").item(0); var node=document.createElement("input");
node.setAttribute("value","Parse"); node.setAttribute("type","button"); node.setAttribute("id","QLSC_MUMU_ButtonParse"); body.appendChild(node); document.getElementById("QLSC_MUMU_ButtonParse").onclick=Start;}window.onload=Init;
- 清理由Word导出的HTML文档的JS脚本
- 清理WORD生成的HTML的脚本
- 关于HTML的word导出
- 导出批注工具--用VBA脚本导出Word评审文档的所有批注
- html页面导出word文档
- html导出 word文档教程
- 把Word转为简洁html的若干方法 清理 拷贝 word 垃圾 代码 ,word 转 html
- PHP网页导出Word文档的方法
- PHP网页导出Word文档的方法
- PHP网页导出Word文档的方法
- Itext导出Word文档的例子
- php导出word文档的代码
- POI导出word文档的基本操作
- freemaker的word文档导出实例使用
- Itext导出Word文档的例子
- java实现的导出word文档
- java 导出word格式的文档
- 清理Word生成HTML的冗余;清理与清除HTML标签
- hibernate中常用的接口和类有哪些?
- 用Java操作Office 2007
- java读写word文档,完美解决方案
- 用ActiveXObject控件替换word书签,将内容导出到word后打印
- jacob 抽取word文档
- 清理由Word导出的HTML文档的JS脚本
- 毕业设计(手机文件管理器源码)
- 太原面试题2-不重复随机数算法
- 使用Lucene2.3构建搜索引
- 学习与交流
- gem中的gem_server找不到了
- istream
- Office Share Point Server 2007标准版和企业版的区别
- 使用CallBack实现页面无刷新技术