apache poi解析excel

来源:互联网 发布:淘宝表格模板 编辑:程序博客网 时间:2024/05/22 02:28

apache poi之解析excel

apache poi是解析ms office的比较好用的工具,可以解析excel,word,ppt,visio。我这里讲一个解析excel的比较粗糙的例子

我使用的是apache poi 3.10

引入以下jar包:

poi-3.10-FINAL-20140208.jar

poi-ooxml-3.10-FINAL-20140208.jar

poi-ooxml-schemas-3.10-FINAL-20140208.jar

dom4j-1.6.1.jar

xmlbeans-2.3.0.jar

由于我只用到其中一部分,没必要引用多余的jar包,请根据自己的需求引用

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
package com.zhou.test;
 
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
 
import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
 
public class ReadXls {
     
    public static void main(String args[]) throws FileNotFoundException, IOException {
        //路径
        String fileToBeRead = "E:\\aaa.xls";
        // 创建对Excel工作簿文件的引用
        HSSFWorkbook workbook = new HSSFWorkbook(new FileInputStream(
                fileToBeRead));
        // 创建对工作表的引用。
        // 本例是按名引用(让我们假定那张表有着缺省名"Sheet1")
        // 也可用getSheetAt(int index)按索引引用,
        // 在Excel文档中,第一张工作表的缺省索引是0,
        // 其语句为:HSSFSheet sheet = workbook.getSheetAt(0);
        HSSFSheet sheet = workbook.getSheet("Sheet1");
        int rows=sheet.getLastRowNum();
        for(int i=0;i<=rows;i++){
            HSSFRow row=sheet.getRow(i);
            int cells=row.getLastCellNum();
            for(int j=0;j<cells;j++){
                HSSFCell cell=row.getCell(j);
                if(cell!=null){
                    if(cell.getCellType()==HSSFCell.CELL_TYPE_STRING){
                        System.out.print(cell.getStringCellValue());
                    }else if(cell.getCellType()==HSSFCell.CELL_TYPE_NUMERIC){
                        System.out.print(cell.getNumericCellValue());
                    }else if(cell.getCellType()==HSSFCell.CELL_TYPE_BOOLEAN){
                        System.out.print(cell.getBooleanCellValue());
                    }
                }
                System.out.print(",");
            }
            System.out.println();
        }
    }
}

上面解析一个aaa.xls的文件,并将内容打印出来,当然,这里打印出来的内容不太准确,

因为单元格类型在api中只提供6种,但是其中并没有日期等。

apache poi也可以解析2007格式的office文档,

操作xlsx相对于xls,api基本是相同的,只是把HSSF都改成XSSF就行。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
package com.zhou.test;
 
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
 
import org.apache.poi.xssf.usermodel.XSSFCell;
import org.apache.poi.xssf.usermodel.XSSFRow;
import org.apache.poi.xssf.usermodel.XSSFSheet;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
 
public class ReadXlsx {
 
    public static void main(String[] args) throws FileNotFoundException, IOException {
        //路径
        String fileToBeRead = "E:\\aaa.xlsx";
        // 创建对Excel工作簿文件的引用
        XSSFWorkbook workbook=new XSSFWorkbook(new FileInputStream(
                fileToBeRead));
        // 创建对工作表的引用。
        XSSFSheet sheet=workbook.getSheetAt(0);
        int rows=sheet.getLastRowNum();
        for(int i=0;i<=rows;i++){
            XSSFRow row=sheet.getRow(i);
            int cells=row.getLastCellNum();
            for(int j=0;j<cells;j++){
                XSSFCell cell=row.getCell(j);
                if(cell!=null){
                    if(cell.getCellType()==XSSFCell.CELL_TYPE_STRING){
                        System.out.print(cell.getStringCellValue());
                    }else if(cell.getCellType()==XSSFCell.CELL_TYPE_NUMERIC){
                        System.out.print(cell.getNumericCellValue());
                    }else if(cell.getCellType()==XSSFCell.CELL_TYPE_BOOLEAN){
                        System.out.print(cell.getBooleanCellValue());
                    }
                }
                System.out.print(",");
            }
            System.out.println();
        }
    }
}
0 0
原创粉丝点击