复合文档文件格式研究

来源:互联网 发布:yrpmr.cab 是什么软件 编辑:程序博客网 时间:2024/05/16 14:04

一直想掌握Excel文件的直接读取方法,寻找其方法找了很久了,现在收集这方面的一些信息如下:

 

1 复合文档简单的说就是在一个文件里可以内嵌其他各种文档,这些内嵌的文档还具有目录结构,可以说复合文档格式就是在一个文件里面实现一个文件系统。从逻辑上说复合文档包含Storage和Stream。Storge相当于我们熟知的操作系统文件系统里的目录,Stream相当于文件。

2 FastExcel的开源项目,它能够使用纯Java代码读取Excel文件的文本内容以及写入内容保存为Excel文件。这项目的作者应该是一个中国人,因为项目源代码中包含的JUnit测试代码里居然有中文数据。把项目的源代码导入到Eclipse编译,运行了附带的测试用例。源代码里的package开头是edu.npu。baidu一下,npu好像是西北工业大学。作者在项目的简介里介绍了代码的工作原理是依照Excel的文件格式,直接进行读取。

3 Excel的文件格式是基于复合文档(Compound Document)的,OpenOffice社区整理有复合文档格式Excel文件格式

4 链接1:http://guooscar.javaeye.com/blog/365356

5 链接2:http://blog.csdn.net/liangjingbo/archive/2008/09/03/2874959.aspx 复合文档格式研究,该篇文档很像OpenOffice社区整理的复合文档格式(compdocfileformat.pdf)的翻译。