利用Python将word 2007的文档转为pdf文件

来源:互联网 发布:淘宝手机排行怎么看 编辑:程序博客网 时间:2024/04/30 03:05

Michael Suodenjoki展示了使用Office的COM接口进行命令行下的转换。但其导出的PDF文档没有书签。在Office 2007 SP2中,微软加入了该功能,对应的接口是ExportAsFixedFormat。该方法不仅适用于Word,而且也适用于Excel。
面是一个简单的Python脚本来展示如何转换DOC为PDF。该脚本需要Office 2007 SP2, Python 2.6与Python for win32(使Python能调用COM)。这里也可以使用其他支持COM的语言。ExportAsFixedFormat还有其他一些参数,具体参见MSDN相关文档。需要注意的是文档路径需要为绝对路径,因为Word启动后当前路径不是调用脚本时的当前路径。

#-*- coding:utf-8 -*-# doc2pdf.py: python script to convert doc to pdf with bookmarks!# Requires Office 2007 SP2# Requires python for win32 extensionimport sys, osfrom win32com.client import Dispatch, constants, gencachedef doc2pdf(input, output):  w = Dispatch("Word.Application")  try:    doc = w.Documents.Open(input, ReadOnly = 1)    doc.ExportAsFixedFormat(output, constants.wdExportFormatPDF,       Item = constants.wdExportDocumentWithMarkup, CreateBookmarks = constants.wdExportCreateHeadingBookmarks)    return 0  except:    return 1  finally:    w.Quit(constants.wdDoNotSaveChanges)# Generate all the support we can.def GenerateSupport():  # enable python COM support for Word 2007  # this is generated by: makepy.py -i "Microsoft Word 12.0 Object Library"  gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 4)def main():  if (len(sys.argv) == 2):    input = sys.argv[1]    output = os.path.splitext(input)[0]+'.pdf'  elif (len(sys.argv) == 3):    input = sys.argv[1]    output = sys.argv[2]  else:    input = u'BA06007013.docx'#word文档的名称    output = u'BA06007013.pdf'#pdf文档的名称  if (not os.path.isabs(input)):    input = os.path.abspath(input)  if (not os.path.isabs(output)):    output = os.path.abspath(output)  try:    GenerateSupport()    rc = doc2pdf(input, output)    return rc  except:    return -1if __name__=='__main__':rc = main()if rc:sys.exit(rc)sys.exit(0)


