从Excel文件读取数据表

来源:互联网 发布:js中的内置对象 编辑:程序博客网 时间:2024/04/28 08:32

 

Java ExcelAPI既可以从本地文件系统的一个文件(.xls),也可以从输入流中读取Excel数据表。读取Excel数据表的第一步是创建Workbook(术语:工作薄),下面的代码片段举例说明了应该如何操作:(完整代码见ExcelReading.java)

Java代码
  1. import java.io.*;  
  2. import jxl.*;  
  3. … … … …  
  4. try  
  5. {  
  6. //构建Workbook对象, 只读Workbook对象  
  7. //直接从本地文件创建Workbook  
  8. //从输入流创建Workbook  
  9.   InputStream is = new FileInputStream(sourcefile);  
  10.   jxl.Workbook rwb = Workbook.getWorkbook(is);  
  11. }  
  12. catch (Exception e)  
  13. {  
  14. e.printStackTrace();  
  15. }  

 
一旦创建了Workbook,我们就可以通过它来访问Excel Sheet(术语:工作表)。参考下面的代码片段:


//获取第一张Sheet表

Java代码
  1. Sheet rs = rwb.getSheet(0);  

 

我们既可能通过Sheet的名称来访问它,也可以通过下标来访问它。如果通过下标来访问的话,要注意的一点是下标从0开始,就像数组一样。

一旦得到了Sheet,我们就可以通过它来访问Excel Cell(术语:单元格)。参考下面的代码片段:


//获取第一行,第一列的值

Java代码
  1. Cell c00 = rs.getCell(00);  
  2. String strc00 = c00.getContents();  

 

//获取第一行,第二列的值

Java代码
  1. Cell c10 = rs.getCell(10);  
  2. String strc10 = c10.getContents();  

 

//获取第二行,第二列的值

Java代码
  1. Cell c11 = rs.getCell(11);  
  2. String strc11 = c11.getContents();  
  3.   
  4. System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());  
  5. System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());  
  6. System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType());  

 

如果仅仅是取得Cell的值,我们可以方便地通过getContents()方法,它可以将任何类型的Cell值都作为一个字符串返回。示例代码中Cell(0, 0)是文本型,Cell(1,0)是数字型,Cell(1,1)是日期型,通过getContents(),三种类型的返回值都是字符型。

如果有需要知道Cell内容的确切类型,API也提供了一系列的方法。参考下面的代码片段:

Java代码
  1. String strc00 = null;  
  2. double strc10 = 0.00;  
  3. Date strc11 = null;  
  4.   
  5. Cell c00 = rs.getCell(00);  
  6. Cell c10 = rs.getCell(10);  
  7. Cell c11 = rs.getCell(11);  
  8.   
  9. if(c00.getType() == CellType.LABEL)  
  10. {  
  11. LabelCell labelc00 = (LabelCell)c00;  
  12. strc00 = labelc00.getString();  
  13. }  
  14. if(c10.getType() == CellType.NUMBER)  
  15. {  
  16. NmberCell numc10 = (NumberCell)c10;  
  17. strc10 = numc10.getValue();  
  18. }  
  19. if(c11.getType() == CellType.DATE)  
  20. {  
  21. DateCell datec11 = (DateCell)c11;  
  22. strc11 = datec11.getDate();  
  23. }  
  24.   
  25. System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());  
  26. System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());  
  27. System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType());  

 
在得到Cell对象后,通过getType()方法可以获得该单元格的类型,然后与API提供的基本类型相匹配,强制转换成相应的类型,最后调用相应的取 值方法getXXX(),就可以得到确定类型的值。API提供了以下基本类型,与Excel的数据格式相对应,如下图所示:


每种类型的具体意义,请参见Java Excel API Document。

当你完成对Excel电子表格数据的处理后,一定要使用close()方法来关闭先前创建的对象,以释放读取数据表的过程中所占用的内存空间,在读取大量数据时显得尤为重要。参考如下代码片段:


//操作完成时,关闭对象,释放占用的内存空间

Java代码
  1. rwb.close();  

 

Java Excel API提供了许多访问Excel数据表的方法,在这里我只简要地介绍几个常用的方法,其它的方法请参考附录中的Java Excel API Document。

Workbook类提供的方法

1. int getNumberOfSheets()
获得工作薄(Workbook)中工作表(Sheet)的个数,示例:

Java代码
  1. jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));  
  2. int sheets = rwb.getNumberOfSheets();  

 
2. Sheet[] getSheets()
返回工作薄(Workbook)中工作表(Sheet)对象数组,示例:

Java代码
  1. jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));  
  2. Sheet[] sheets = rwb.getSheets();  

 
3. String getVersion()
返回正在使用的API的版本号,好像是没什么太大的作用。

Java代码
  1. jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));  
  2. String apiVersion = rwb.getVersion();  

 
Sheet接口提供的方法

1) String getName()
获取Sheet的名称,示例:

Java代码
  1. jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));  
  2. jxl.Sheet rs = rwb.getSheet(0);  
  3. String sheetName = rs.getName();  

 
2) int getColumns()
获取Sheet表中所包含的总列数,示例:

Java代码
  1. jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));  
  2. jxl.Sheet rs = rwb.getSheet(0);  
  3. int rsColumns = rs.getColumns();  

 
3) Cell[] getColumn(int column)
获取某一列的所有单元格,返回的是单元格对象数组,示例:

Java代码
  1. jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));  
  2. jxl.Sheet rs = rwb.getSheet(0);  
  3. Cell[] cell = rs.getColumn(0);  

 
4) int getRows()
获取Sheet表中所包含的总行数,示例:

Java代码
  1. jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));  
  2. jxl.Sheet rs = rwb.getSheet(0);  
  3. int rsRows = rs.getRows();  

 
5) Cell[] getRow(int row)
获取某一行的所有单元格,返回的是单元格对象数组,示例子:

Java代码
  1. jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));  
  2. jxl.Sheet rs = rwb.getSheet(0);  
  3. Cell[] cell = rs.getRow(0);  

 
6) Cell getCell(int column, int row)
获取指定单元格的对象引用,需要注意的是它的两个参数,第一个是列数,第二个是行数,这与通常的行、列组合有些不同。

Java代码
  1. jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));  
  2. jxl.Sheet rs = rwb.getSheet(0);  
  3. Cell cell = rs.getCell(00);  

 
2 生成新的Excel工作薄

下面的代码主要是向大家介绍如何生成简单的Excel工作表,在这里单元格的内容是不带任何修饰的(如:字体,颜色等等),所有的内容都作为字符串写入。(完整代码见ExcelWriting.java)

与读取Excel工作表相似,首先要使用Workbook类的工厂方法创建一个可写入的工作薄(Workbook)对象,这里要注意的是,只能通过API提供的工厂方法来创建Workbook,而不能使用WritableWorkbook的构造函数,因为类WritableWorkbook的构造函数为protected类型。示例代码片段如下:

Java代码
  1. import java.io.*;  
  2. import jxl.*;  
  3. import jxl.write.*;  
  4. … … … …  
  5. try  
  6. {  
  7. //构建Workbook对象, 只读Workbook对象  
  8. //Method 1:创建可写入的Excel工作薄  
  9.   jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(new File(targetfile));  
  10.   
  11. //Method 2:将WritableWorkbook直接写入到输出流  
  12. /* 
  13.   OutputStream os = new FileOutputStream(targetfile); 
  14.   jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(os); 
  15. */  
  16. }  
  17. catch (Exception e)  
  18. {  
  19. e.printStackTrace();  
  20. }  

 
API提供了两种方式来处理可写入的输出流,一种是直接生成本地文件,如果文件名不带全路径的话,缺省的文件会定位在当前目录,如果文件名带有全路径的话,则生成的Excel文件则会定位在相应的目录;另外一种是将Excel对象直接写入到输出流,例如:用户通过浏览器来访问Web服务器,如果HTTP头设置正确的话,浏览器自动调用客户端的Excel应用程序,来显示动态生成的Excel电子表格。

接下来就是要创建工作表,创建工作表的方法与创建工作薄的方法几乎一样,同样是通过工厂模式方法获得相应的对象,该方法需要两个参数,一个是工作表的名称,另一个是工作表在工作薄中的位置,参考下面的代码片段:


//创建Excel工作表

Java代码
  1. jxl.write.WritableSheet ws = wwb.createSheet("Test Sheet 1"0);  

 

"这锅也支好了,材料也准备齐全了,可以开始下锅了!",现在要做的只是实例化API所提供的Excel基本数据类型,并将它们添加到工作表中就可以了,参考下面的代码片段:


//1.添加Label对象

Java代码
  1. jxl.write.Label labelC = new jxl.write.Label(00"This is a Label cell");  
  2. ws.addCell(labelC);  
  3.   
  4. //添加带有字型Formatting的对象  
  5. jxl.write.WritableFont wf = new jxl.write.WritableFont(WritableFont.TIMES, 18, WritableFont.BOLD, true);  
  6. jxl.write.WritableCellFormat wcfF = new jxl.write.WritableCellFormat(wf);  
  7. jxl.write.Label labelCF = new jxl.write.Label(10"This is a Label Cell", wcfF);  
  8. ws.addCell(labelCF);  
  9.   
  10. //添加带有字体颜色Formatting的对象  
  11. jxl.write.WritableFont wfc = new jxl.write.WritableFont(WritableFont.ARIAL, 10, WritableFont.NO_BOLD, false,  
  12. UnderlineStyle.NO_UNDERLINE, jxl.format.Colour.RED);  
  13. jxl.write.WritableCellFormat wcfFC = new jxl.write.WritableCellFormat(wfc);  
  14. jxl.write.Label labelCFC = new jxl.write.Label(10"This is a Label Cell", wcfFC);  
  15. ws.addCell(labelCF);  

 

//2.添加Number对象

Java代码
  1. jxl.write.Number labelN = new jxl.write.Number(013.1415926);  
  2. ws.addCell(labelN);  
  3.   
  4. //添加带有formatting的Number对象  
  5. jxl.write.NumberFormat nf = new jxl.write.NumberFormat("#.##");  
  6. jxl.write.WritableCellFormat wcfN = new jxl.write.WritableCellFormat(nf);  
  7. jxl.write.Number labelNF = new jxl.write.Number(113.1415926, wcfN);  
  8. ws.addCell(labelNF);  

 

//3.添加Boolean对象

Java代码
  1. jxl.write.Boolean labelB = new jxl.write.Boolean(02false);  
  2. ws.addCell(labelB);  

 

//4.添加DateTime对象

Java代码
  1. jxl.write.DateTime labelDT = new jxl.write.DateTime(03new java.util.Date());  
  2. ws.addCell(labelDT);  
  3.   
  4. //添加带有formatting的DateFormat对象  
  5. jxl.write.DateFormat df = new jxl.write.DateFormat("dd MM yyyy hh:mm:ss");  
  6. jxl.write.WritableCellFormat wcfDF = new jxl.write.WritableCellFormat(df);  
  7. jxl.write.DateTime labelDTF = new jxl.write.DateTime(13new java.util.Date(), wcfDF);  
  8. ws.addCell(labelDTF);  

 

这里有两点大家要引起大家的注意。第一点,在构造单元格时,单元格在工作表中的位置就已经确定了。一旦创建后,单元格的位置是不能够变更的,尽管单元格的 内容是可以改变的。第二点,单元格的定位是按照下面这样的规律(column, row),而且下标都是从0开始,例如,A1被存储在(0,0),B1被存储在(1, 0)。

最后,不要忘记关闭打开的Excel工作薄对象,以释放占用的内存,参见下面的代码片段:


//写入Exel工作表

Java代码
  1. wwb.write();  

 

//关闭Excel工作薄对象

Java代码
  1. wwb.close();  

 

这可能与读取Excel文件的操作有少少不同,在关闭Excel对象之前,你必须要先调用write()方法,因为先前的操作都是存储在缓存中的,所以要通过该方法将操作的内容保存在文件中。如果你先关闭了Excel对象,那么只能得到一张空的工作薄了。

3 拷贝、更新Excel工作薄

接下来简要介绍一下如何更新一个已经存在的工作薄,主要是下面二步操作,第一步是构造只读的Excel工作薄,第二步是利用已经创建的Excel工作薄创建新的可写入的Excel工作薄,参考下面的代码片段:(完整代码见ExcelModifying.java)


//创建只读的Excel工作薄的对象

Java代码
  1. jxl.Workbook rw = jxl.Workbook.getWorkbook(new File(sourcefile));  

 

//创建可写入的Excel工作薄对象

Java代码
  1. jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(new File(targetfile), rw);  

        
//读取第一张工作表

Java代码
  1. jxl.write.WritableSheet ws = wwb.getSheet(0);  

 

//获得第一个单元格对象

Java代码
  1. jxl.write.WritableCell wc = ws.getWritableCell(00);  

        
//判断单元格的类型, 做出相应的转化

Java代码
  1. if(wc.getType() == CellType.LABEL)  
  2. {  
  3. Label l = (Label)wc;  
  4.   l.setString("The value has been modified.");  
  5. }  

 

//写入Excel对象

Java代码
  1. wwb.write();  

 

//关闭可写入的Excel对象

Java代码
  1. wwb.close();  

 

//关闭只读的Excel对象

Java代码
  1. rw.close();  

 


之所以使用这种方式构建Excel对象,完全是因为效率的原因,因为上面的示例才是API的主要应用。为了提高性能,在读取工作表时,与数据相关的一些输出信息,所有的格式信息,如:字体、颜色等等,是不被处理的,因为我们的目的是获得行数据的值,既使没有了修饰,也不会对行数据的值产生什么影响。唯一的不利之处就是,在内存中会同时保存两个同样的工作表,这样当工作表体积比较大时,会占用相当大的内存,但现在好像内存的大小并不是什么关键因素了。

一旦获得了可写入的工作表对象,我们就可以对单元格对象进行更新的操作了,在这里我们不必调用API提供的add()方法,因为单元格已经于工作表当中,所以我们只需要调用相应的setXXX()方法,就可以完成更新的操作了。

尽单元格原有的格式化修饰是不能去掉的,我们还是可以将新的单元格修饰加上去,以使单元格的内容以不同的形式表现。

新生成的工作表对象是可写入的,我们除了更新原有的单元格外,还可以添加新的单元格到工作表中,这与示例2的操作是完全一样的。

最后,不要忘记调用write()方法,将更新的内容写入到文件中,然后关闭工作薄对象,这里有两个工作薄对象要关闭,一个是只读的,另外一个是可写入的

 

其他操作

一、 数据格式化

在Excel中不涉及复杂的数据类型,能够比较好的处理字串、数字和日期已经能够满足一般的应用。

1、 字串格式化

字符串的格式化涉及到的是字体、粗细、字号等元素,这些功能主要由WritableFont和
WritableCellFormat类来负责。假设我们在生成一个含有字串的单元格时,使用如下语句,
为方便叙述,我们为每一行命令加了编号:

Java代码
  1. WritableFont font1 =      
  2.  new  WritableFont(WritableFont.TIMES, 16 ,WritableFont.BOLD); ①     
  3.     
  4. WritableCellFormat format1 = new  WritableCellFormat(font1); ②     
  5.     
  6. Label label = new  Label( 0 , 0 ,”data  4  test”,format1) ③     
  7.     
  8.     
  9.  其中①指定了字串格式:字体为TIMES,字号16,加粗显示。WritableFont有非常丰富的     
  10. 构造子,供不同情况下使用,jExcelAPI的java-doc中有详细列表,这里不再列出。     
  11.     
  12. ②处代码使用了WritableCellFormat类,这个类非常重要,通过它可以指定单元格的各种     
  13. 属性,后面的单元格格式化中会有更多描述。     
  14.     
  15. ③处使用了Label类的构造子,指定了字串被赋予那种格式。     
  16.     
  17. 在WritableCellFormat类中,还有一个很重要的方法是指定数据的对齐方式,比如针对我们     
  18. 上面的实例,可以指定:     
  19.     
  20.   // 把水平对齐方式指定为居中      
  21.  format1.setAlignment(jxl.format.Alignment.CENTRE);     
  22.     
  23.  // 把垂直对齐方式指定为居中      
  24.  format1.setVerticalAlignment(jxl.format.VerticalAlignment.CENTRE);     

 

二、单元格操作

Excel中很重要的一部分是对单元格的操作,比如行高、列宽、单元格合并等,所幸jExcelAPI
提供了这些支持。这些操作相对比较简单,下面只介绍一下相关的API。

1、 合并单元格

Java代码
  1. WritableSheet.mergeCells( int  m, int  n, int  p, int  q);      
  2.     
  3. // 作用是从(m,n)到(p,q)的单元格全部合并,比如:      
  4. WritableSheet sheet = book.createSheet(“第一页”, 0 );     
  5.     
  6. // 合并第一列第一行到第六列第一行的所有单元格      
  7. sheet.mergeCells( 0 , 0 , 5 , 0 );     

 

合并既可以是横向的,也可以是纵向的。合并后的单元格不能再次进行合并,否则会触发异常。

2、 行高和列宽

Java代码
  1. WritableSheet.setRowView( int  i, int  height);     
  2.     
  3.  // 作用是指定第i+1行的高度,比如:     
  4.     
  5.  // 将第一行的高度设为200      
  6.  sheet.setRowView( 0 , 200 );     
  7.     
  8. WritableSheet.setColumnView( int  i, int  width);     
  9.     
  10.  // 作用是指定第i+1列的宽度,比如:     
  11.     
  12.  // 将第一列的宽度设为30      
  13.  sheet.setColumnView( 0 , 30 );     

 

原创粉丝点击