实现一个具有百度文库文档转换功能的工具类

来源:互联网 发布:jre-7u9-windows-x64 编辑:程序博客网 时间:2024/06/05 03:20

用过百度文库、豆丁的朋友,都知道,我们只要将文档上传到这些网站上,就可以实现分享。无论你上传的是pdfppt,还是doctxtpptx文件,都会在网页上显示给用户看。从技术上简单地说,可以分成三步:


1)将格式为x的文档文件上传到服务器;

2)在服务器上完成文档的相关处理;

3)将处理后的结果展示在网页上。


其中最关键的一步就是(2)。做技术的人都可以很容易地看出来,这类用web应用是用flash显示出来的。那么,一个文档文件,是如何转换为swf文件的呢?本文就将为你介绍,如何避免再造车轮的冗余行为发生,而借助高效的工具将docpptpdf等文档文件转换为swf格式。比如百度文库接收用户上传的文件后,显示在网页上时是其转换成的SWF格式文件。这样就很适合Web应用了。


一、JODConverter


    首先利用JODConverterdocppttxtdocx等文件转换为pdf文件。然后用SwfToolspdf文件转换为swf文件。JODConverter是一个名叫Java OpenDocument Converter的基于LGPL协议的软件,用于实现不同的office格式之间的转换,这些office格式包括Microsoft OfficeOpenOfficeJODConverter的项目主页是http://www.artofsolving.com/opensource/jodconverter ,可以查看更多的信息。可以通过SourceForge.net 下载。


    首先要安装OpenOfficeJODConverter的功能,基本就是实现了OpenOffice中的另存为的功能。个版本的OpenOffice的下载地址为:


Language 

The names do not refer to countries.

 

Windows 

Intel 

MSI

Linux 

Intel 

RPM

Linux 

Intel 

DEB

Linux 

x86-64

RPM

Linux 

x86-64

DEB

Mac OS

Intel 

DMG

Mac OS

PPC ¹

DMG

Solaris 

Intel 

PKG

Solaris 

Sparc 

PKG

Arabic

عربي

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Basque

Euskara

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Bengali

বাংলা

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Bulgarian

български език

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Catalan

Català

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Catalan (Valencian)

Català (Valencià)

Download 

Download 

Download 

Download 

Download 

Download 

not available

Download 

Download 

Chinese (simplified)

简体中文

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Chinese (traditional)

正體中文

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Czech

čeština

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Danish

Dansk

Download 

Download 

Download 

Download 

Download 

Download 

3.2.1 

Download 

Download 

Dutch

Nederlands

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

English (British)

English (British)

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

English (US)

English (US)

Download 

Download 

Download 

Download 

Download 

Download 

3.2.1 

Download 

Download 

Estonian

Eesti keel

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Finnish

Suomi

Download 


Download 



3.2.1 

Download 

Download 

Download 

French

Français

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Galician

Galego

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

German

Deutsch

Download 

3.2.1 

Download 

3.2.1 

3.2.1 

Download 

3.2.0 

Download 

Download 

Greek

Ελληνικά

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Hebrew

עִבְרִית

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Hungarian

Magyar

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Irish

Gaeilge

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Italian

Italiano

Download 

Download 

Download 

Download 

Download 

Download 




Language 

The names do not refer to countries.

 

Windows 

Intel 

MSI

Linux 

Intel 

RPM

Linux 

Intel 

DEB

Linux 

x86-64

RPM

Linux 

x86-64

DEB

Mac OS

Intel 

DMG

Mac OS

PPC ¹

DMG

Solaris 

Intel 

PKG

Solaris 

Sparc 

PKG

Japanese

日本語

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Khmer

ភាសាខ្មែរ

Download 

Download 

Download 

Download 

Download 

Download 

3.2.1 

Download 

Download 

Korean

한국어

Download 

Download 

Download 



Download 


Download 

Download 

Kurdish

Kurdî

3.2.1 









Lithuanian

Lietuvių

Download 

Download 

Download 

Download 

Download 

Download 

3.0.1 

Download 

Download 

Macedonian

Македонски

Download 

Download 

Download 

Download 

Download 

Download 

3.0.0 

Download 

Download 

Mongolian

Монгол

3.0.0 

3.0.0 

3.0.0 







Norwegian (Bokmål)

Norsk (Bokmål)

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Norwegian (Nynorsk)

Norsk (Nynorsk)

3.2.0 

3.2.0 

3.2.0 

3.2.0 

3.2.0 





Oromo

ኦሮሚኛ

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Polish

Polski

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Portuguese (Brazilian)

Português (do Brasil)

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Portuguese (European)

Português (Europeu)

Download 

Download 

Download 

3.2.1 

3.2.1 

Download 


Download 

Download 

Russian

Русский

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Serbian (Cyrillic)

Cрпски (ћирилицом)

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Serbian (Latin)

Srpski (latinicom)

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Slovenian

Slovenski jezik

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Download 

Spanish

Español

Download 

Download 

Download 

Download 

Download 

Download 

3.0.0 

Download 

Download 

Swedish

Svenska

Download 

Download 

Download 

Download 

Download 

Download 

3.1.0 

Download 

Download 

Turkish

Türkçe

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 

Vietnamese

Tiếng Việt

Download 

Download 

Download 

Download 

Download 

Download 


Download 

Download 


    安装完OpenOffice后,要记住你的OfficeHome。不同平台的OfficeHome是不同的。比如你将OpenOffice安装到Windows“D:\Program Files\OpenOffice.org 3”,那么这就是你在Windows上的OfficeHome。如果你是Linux用户,你可能会将OpenOffice安装到“/opt/openoffice.org3”,这就是你的OfficeHome。如果你是Mac用户,在Mac系统的自动安装后,你需要知道你的OfficeHome“/Application/OpenOffice.org.app/Contents”

   一定要知道你的OfficeHome,否则JODConverter是没法工作的。然后下载JODConverter API,下载页:http://sourceforge.net/projects/jodconverter/ 


二、SwfTools


    然后利用SwfTools就中间生成的pdf文件,转换为swf文件。SwfTools是将各种不同格式的文件转换为Adobe Flashswf格式文件的软件,可以运行在LinuxMacFreeBSDUnix-like系统以及Windows系统上。它可以实现pdfaviwavpngjpeggif等格式向swf格式的转换。该项目主页是http://www.swftools.org/ ,在http://www.swftools.org/download.htmlx下载 。


1WindowsLinuxMac用户可以忽略)

1)下载安装swftools

下载地址:swftools-0.9.1.exe 

安装目录:D:\Program Files\swftools


2)将不同格式的文件转换为SWF

使用安装目录下的转换命令:

[plain] view plaincopy
  1. avi2swf inputFile -o outputFile  
  2. font2swf inputFile -o outputFile  
  3. gif2swf inputFile -o outputFile  
  4. jpeg2swf inputFile -o outputFile  
  5. pdf2swf inputFile -o outputFile  
  6. png2swf inputFile -o outputFile  
  7. wav2swf inputFile -o outputFile  



2LinuxWindowsMac用户可以忽略)

1)安装依赖库

[plain] view plaincopy
  1. sudo apt-get install libpng12-dev  
  2. sudo apt-get install libjpeg62-dev  
  3. sudo apt-get install libgif-dev  
  4. sudo apt-get install libfreetype6-dev  

2)安装swftools

[plain] view plaincopy
  1. wget http://www.swftools.org/swftools-0.9.1.tar.gz  
  2. tar zxvf swftools-0.9.1.tar.gz  
  3. cd swftools-0.9.1  
  4. ./configure  
  5. make  
  6. sudo make install  

3)将其他文件格式转换为SWF

参考Windows平台上的SwfTools使用。


3MacWindowsLinux用户可以忽略)

1)安装swftools

最简单的方式,是用macportfink等来安装。macport的命令为:

[plain] view plaincopy
  1. sudo port install swftools  

MacPort安装SwfTools,不需要考虑其依赖库,MacPort会帮助你安装好。MacPort的安装,请参考《Mac OS X Lion安装MacPorts(让你在MacShell下更加游刃有余)》一文。


2)将其他文件格式转换为SWF

参考Windows平台上的SwfTools使用。


三、Java实例实现各office文件格式向swf的转换


创建一个实现类型转换的工具类,命名为FileConverterUtil,如下:


[java] view plaincopy
  1. public class FileConverterUtil {  
  2.     public static String fileToSwf(String inputFilePath) {  
  3.         return pdfToSwf(fileToPdf(inputFilePath));  
  4.     }  
  5.     private static String fileToPdf(String inputFilePath) {  
  6.         //...  
  7.     }  
  8.     private static String pdfToSwf(String inputFilePath) {  
  9.         //...  
  10.     }  
  11. }  


然后分别实现fileToPdfpdfToSwffileToPdf中使用到JODConverterAPI,如下:


[java] view plaincopy
  1. import org.artofsolving.jodconverter.office.DefaultOfficeManagerConfiguration;  
  2. import org.artofsolving.jodconverter.office.OfficeManager;  
  3. import org.artofsolving.jodconverter.OfficeDocumentConverter;  
  4. import java.io.File;  
  5.   
  6. private static String fileToPdf(String inputFilePath) {  
  7.     DefaultOfficeManagerConfiguration config = new DefaultOfficeManagerConfiguration();  
  8.           
  9.     String officeHome = getOfficeHome();  
  10.     config.setOfficeHome(officeHome);  
  11.       
  12.     OfficeManager officeManager = config.buildOfficeManager();  
  13.     officeManager.start();  
  14.   
  15.     OfficeDocumentConverter converter = new OfficeDocumentConverter(officeManager);  
  16.     String outputFilePath = getOutputFilePath(inputFilePath);  
  17.     converter.convert(new File(inputFilePath), new File(outputFilePath));  
  18.   
  19.     officeManager.stop();  
  20. }  

其中getOfficeHome()可以根据你使用该工具类的平台增加程序的可移植性。fileToPdf可以实现各种office文件到pdf文件的转换。


[java] view plaincopy
  1. private static String getOfficeHome(String inputFilePath) {  
  2.     String osName = System.getProperty("os.name");  
  3.     if (Pattern.matches("Linux.*", osName) {  
  4.         return "/opt/openoffice.org3";  
  5.     } else if (Pattern.matches("Windows.*", osName) {  
  6.         return "D:\\Applications\\OpenOffice.org 3";  
  7.     } else if (Pattern.matches("Mac.*", osName) {  
  8.         return "/Application/OpenOffice.org.app/Contents";  
  9.     }  
  10.     return null;  
  11. }  


提供统一的转换文件命名规则,可以提供如下方法,具体实现看你应用场景的方便性了。


[java] view plaincopy
  1. private static String getOutputFilePath(String inputFilePath) {  
  2.     // Initialized by yourself.  
  3. }  

然后利用SwfTools实现PdfToSwf方法。


[java] view plaincopy
  1. private static String pdfToSwf(String inputFilePath) {  
  2.     try {  
  3.         String outputFilePath = getOutputFilePath(inputFilePath);  
  4.         String[] command = new String[4];  
  5.         command[0] = getSwftoolsHome();  
  6.         command[1] = inputFilePath;  
  7.         command[2] = "-o";  
  8.         command[3] = outputFilePath;  
  9.         Process process = Runtime.getRuntime().exec(command);  
  10.         process.waitFor();  
  11.         return outputFilePath;  
  12.     } catch (Exception e) {  
  13.         // initialized by yourself.  
  14.     }  
  15. }  


其中getSwftoolsHome方法就是获取你的SwfTools所在目录,依据不同平台,你可以如下实现该方法:


[java] view plaincopy
  1. private static String getSwftoolsHome() {  
  2.     String osName = System.getProperty("os.name");  
  3.     if (Pattern.matches("Linux.*", osName) {  
  4.         return "/usr/local/bin";  
  5.     } else if (Pattern.matches("Windows.*", osName) {  
  6.         return "D:\\Program Files\\SwfTools";  
  7.     } else if (Pattern.matches("Mac.*", osName) {  
  8.         return "/usr/local/bin";  
  9.     }  
  10.     return null;  
  11. }  

这样类似于百度文库、豆丁网的文档转换工具的核心功能就基本实现了。Enjoy It

原创粉丝点击