nodejs将word文档转为html文件(脚本)--获取word文档内容
来源:互联网 发布:手机基站定位软件 编辑:程序博客网 时间:2024/05/14 10:49
本来是想写 用nodejs 或者 js 将word文档转为html的脚本,
js在IE浏览器下有 new ActiveApplication 对象可以 获取文档
nodejs 获取文档看这篇http://www.jianshu.com/p/68a420a68ded 因为还没时间整理 所以先给大家个链接
思路是这样,先获取文档内容, 可以用代码得到内容也就是跟我们通过接口获取服务端的数据一样了,之后变可以 用js 拼接出一个html 文件
let fs = require("node-fs") let AdmZip = require('adm-zip') let zip = new AdmZip('./help.zip') let contentXml = zip.readAsText("word/document.xml") let str = "" let arr = [] let header = "<!DOCTYPE html>\n" + "<html lang=\"en\">\n" + "<head>\n" + " <meta charset=\"UTF-8\">\n" + " <title>Title</title>\n" + "</head>\n" + "<body>" let footer = "</body>\n" + "</html>" let one = '' // console.log('111',contentXml) // console.log('111',contentXml.match(/<w:t>[\S]*?<\/w:t>/ig)) // return // contentXml.match(/<w:t xml:space="preserve">[\S]*?<\/w:t>/ig).forEach((item,index,array) => { contentXml.match(/<w:t>[\S]*?<\/w:t>/ig).forEach((item,index,array) => { // console.log(index+':'+'刚进入循环的str:',str) // let tem = item.slice(26, -6) let tem = item.slice(5, -6) // console.log(array[index].slice(26, -6),array[index].slice(26, -6).length) // return // console.log(index,':',tem) if (tem && tem !== "" && tem !== " " && tem !== " " && tem !== " ") { if (tem.length === 1) { // console.log('tem为1的时候的tem:',tem) // str += tem if (str !== '') { // console.log('str不为空的时候的str',str) one = tem // str = str.slice(0,-5) + tem + '</p>' } else { // console.log('str空的时候') } } else { // console.log('tem非1的时候的tem',tem) str +='<p>' + one + tem + '</p>' + "\n" // console.log('tem非1的时候的str',str) one = '' } } // console.log(index+':'+'出循环的str',str) })// return str = header + "\n" + str + "\n" + footer console.log('我要输出了') fs.writeFile("./help.html",str,(err) => { console.log('111',err) })returnif (!arr[1]) { arr.splice(1, 1);}arr.forEach((item, index, arr) => { if (!item || item === ' ') { arr.splice(index, 1) }})arr.forEach((item, index, array) => { if (item.length === 1) { array[index - 1] = array[index - 1] + item }})fs.writeFile("./documentXml.txt", contentXml, (err) => { console.log(err)})fs.writeFile("./numbering.txt", numberingXml, (err) => { console.log(err)})fs.writeFile("./styles.txt", stylesXML, (err) => { console.log(err)})// str += '<p>' + item.slice(26, -6) + '</p>'// arr.push(item.slice(26, -6))
阅读全文
0 0
- nodejs将word文档转为html文件(脚本)--获取word文档内容
- 将html内容写入word文档
- 利用Python将word 2007的文档转为pdf文件
- 怎么将word文档转为pdf
- 用脚本将Word文档内容放入IFrame的雕虫小技
- JS获取word文档内容到html页面
- Perl Word文档转为TXT文件
- OpenOffice 将word文档转为pdf再转为图片
- 将数据库的内容生成WORD文档
- 将Word文档中指定内容锁定
- 将word文档转成html获取数据库中对应值,并将jsp页面打印成word文档。
- 用java将Word文档转Html
- 用java将Word文档转Html
- 用java将Word文档转Html
- Java 将Word文档转换Html
- C# 将Word文档转换为HTML
- C# 将Word文档转换为HTML
- 将word文档转化为html(代码)
- 基于sqlserver的常用查询、视图、触发器、存储过程用法
- Ruby基础知识学习
- Codeforces Round #440(div2)
- 点击列表跳转网页(webView)
- 贪心算法(1)
- nodejs将word文档转为html文件(脚本)--获取word文档内容
- java.util.concurrent包中的BlockingQuene
- scrapy爬取图片
- 特征工程怎么做
- [LeetCode] 435. Non-overlapping Intervals
- 贪心算法(2)
- 基于angular实现分页工具条展示
- 51nod 1106 质数检测
- 1020. 月饼 (25)