python doc word文件转txt、html
来源:互联网 发布:免费解压软件 编辑:程序博客网 时间:2024/05/18 16:58
下载pywin32
win32com
重点语法:
doc.SaveAs(os.path.join(parent,'html',title+'.html') ,8)os.mkdir(os.path.join(parent,'txt'))doc.SaveAs(os.path.join(parent,'txt', title + '.txt'),4)# -*- coding:utf-8 -*-import osfrom win32com import client as wcrootdir =os.getcwd()word = wc.Dispatch('Word.Application')try: f_list = [] os_dict = {i:[j,k] for i ,j,k in os.walk(rootdir)} for parent,dirnames,filenames in os.walk(rootdir): for filename in filenames: if u'.doc' in filename and u'~$' not in filename: title = filename[:-4] f_list.append(filename) word.Visible = 0 doc = word.Documents.Open(os.path.join(parent,filename)) if u'txt' in dirnames : if title+'.txt' not in os_dict[os.path.join(parent,'txt')][1]: doc.SaveAs(os.path.join(parent,'txt',title+'.txt'), 4) else: os.mkdir(os.path.join(parent,'txt')) doc.SaveAs(os.path.join(parent,'txt', title + '.txt'),4) if u'html' in dirnames: if title + '.html' not in os_dict[os.path.join(parent, 'html')][1]: doc.SaveAs(os.path.join(parent,'html',title+'.html') ,8) else: os.mkdir(os.path.join(parent,'html')) doc.SaveAs(os.path.join(parent,'html', title + '.html'), 8)finally: word.Quit()print(f_list)
0 0
- python doc word文件转txt、html
- 【word | html】word(doc | docx) 转 html
- POI把html写入word doc文件
- POI Word DOC格式转Html
- php实现把html转word,doc
- Java 使用jacob ppt文件转pptx,doc转docx;word 转html、pdf等
- Java 网页html转为word并保存为doc文件
- 读取Doc,Excel,PDF,html,生成Txt文件,读取Txt生成Excel文件
- vc把文字内容存成word文件和把doc文件保存为txt格式
- java把word转html或txt
- java把word转html或txt
- excel,word,txt,img,pdf,转html
- lucene索引word/pdf/html/txt文件及检索(搜索引擎)
- lucene索引word/pdf/html/txt文件及检索(搜索引擎)
- 用Python编写函数实现 创建一个.txt文件或者.doc文件
- python matplotlib阶段性总结——word转txt、绘图、文件操作
- python matplotlib阶段性总结——word转txt、绘图、文件操作
- Python转换office word文件为HTML
- 常见问题以及解决方案
- poj EXTENDED LIGHTS OUT 高斯消元
- bzoj2621 [Usaco2012 Mar]Cows in a Skyscraper奶牛乘电梯
- android studio中如何将一个项目的apk安装包输出到其他工程目录下
- uva 10106 Product 大数相乘
- python doc word文件转txt、html
- java运算符计算整理
- 每天一个算法之寻找第一个只出现一次的数
- EL表达式学习
- java经纬度两点距离计算方法
- charles 为什么能抓https的包?原理是什么?
- MaterialDesignColor谷歌官方的MaterialDesign颜色代码
- 图像处理相关问题
- caffe对自定义数据集进行分类