python 把一个文件夹下的docx转化为doc
来源:互联网 发布:python amf 编辑:程序博客网 时间:2024/05/16 08:38
因为要用java批量处理word文档的需要,需要用到的类型是doc,可是待处理的文档却是docx格式的,所以有了批量将docx转化为doc的需要,下面的脚本用于遍历一个文件夹下将所有的docx文档另存为doc,普通的重命名虽然最终得到的doc可以用docx打开操作,但其实内部的格式与doc是不吻合的,当用java的第三方工具读取时会出错,下面的函数应用到了python win32 的功能,SaveAs(docxFullName,1)中,后面的参数设为1,那么保存得到的文件将是doc格式的
#coding=gb2312
from win32com import client as wc
import os
word = wc.Dispatch('Word.Application')
#word.Visible = True #是否可见
#word.DisplayAlerts = 0
def docx2doc(dir):
i=0
j=0
for path, subdirs, files in os.walk(dir):
for wordFile in files:
wordFullName = os.path.join(path, wordFile)
dotIndex = wordFile.rfind(".")
if(dotIndex!=-1):
try:
fileSuffix = wordFile[(dotIndex + 1) : ]
if(fileSuffix == "docx"):
fileName = wordFile[:dotIndex]
docxName = fileName + ".doc"
docxFullName = os.path.join(r'E:\docx2docResult', docxName)
print '正在转化:'+wordFullName
doc = word.Documents.Open(wordFullName)
i+=1
doc.SaveAs(docxFullName,1)
doc.Close()
except Exception:
j+=1
print wordFullName+':该文件保存失败****************************************'
word.Quit()
print '尝试转换'+str(i)+'个docx'
print '其中成功的有:'+str(i-j)+'个'
print '失败的共有:'+str(j)+'个'
if __name__ == '__main__':
docx2doc(r"E:\folder")
- python 把一个文件夹下的docx转化为doc
- python 在linux中把doc转换为docx格式文件(支持word97和word2003)
- 如何把docx转成doc
- Ubuntu下使用python读取doc和docx文档的内容
- 他妈的 Python(2):把一个类转化为 dict 字典
- "doc", "docx", "xls", "xlsx", "ppt", "pptx",txt。等文件转化为pdf
- DOC与DOCX的区别
- 能把汉字转化为拼音的一个函数
- 能把汉字转化为拼音的一个函数
- 能把汉字转化为拼音的一个函数
- 能把汉字转化为拼音的一个函数
- 把一个十六制的字符串转化为整形
- 怎么把一个字符串转化为资源的id?
- 能把汉字转化为拼音的一个函数
- 把一个数转化为二进制的模板
- 把一个十进制数转化为二进制的方法
- Python中对文件夹下的特定格式图像全部读取并转化为数组保存(也可转化为txt文件)
- 交互环境下的把数值转化为货币单位
- 作为软件工程师,你必须知道的20个常识
- recordset的rs.open语句是怎样的
- Android GPS定位获取当前位置
- android 双击事件监听
- Android属性动画---Property Animation(一)
- python 把一个文件夹下的docx转化为doc
- 关于德国网络创投圈,不可不知Samwer三兄弟
- linux修改swap虚拟内存大小
- Cygwin安装Gitolite3
- reflection 反射 Java中的动态机制
- perl学习(三)
- 研发成功了从Sybase SQL Anywhere的DB文件上恢复数据的工具
- Android动画开发——Animation动画效果
- 社会网络分析中的社区发现