Java中使用Apache POI使用解析excel文件
来源:互联网 发布:高中数学知乎 编辑:程序博客网 时间:2024/05/22 10:35
背景:
最近要做个功能,将excel上传后,然后将其中间的某些列的数据插入到数据库中,然后我需要解析excel文件,将中间的某些数据提取出来。
java中解析excel文件可以使用 jxl,也可以使用poi,他们具体的差别就不说了。
POI是属于Apache的,它相应的文档:
官方主页: http://poi.apache.org/index.html
API文档: http://poi.apache.org/apidocs/index.html
第一步:加载poi.jar包
我这里使用的是 poi-3.7.jar 这个版本。
pom文件:
<dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>3.7</version> </dependency>
第二步:了解下它常见的类:
XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。
HWPF - 提供读写Microsoft Word DOC97格式档案的功能。
XWPF - 提供读写Microsoft Word DOC2003格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读Microsoft Visio格式档案的功能。
HPBF - 提供读Microsoft Publisher格式档案的功能。
HSMF - 提供读Microsoft Outlook格式档案的功能。
主要是这三个类,HSSFWorkbook,HSSFSheet,HSSFRow。
第三步,解析示例:
package com.sfpay.excel.exceldispose;import java.io.BufferedInputStream;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import org.apache.poi.hssf.usermodel.HSSFRow;import org.apache.poi.hssf.usermodel.HSSFSheet;import org.apache.poi.hssf.usermodel.HSSFWorkbook;import org.apache.poi.poifs.filesystem.POIFSFileSystem;public class OperationExcel {/** * 读取excel文件 * @param file * @throws FileNotFoundException */public void readExcelTest(File file) throws FileNotFoundException, IOException {FileInputStream fis = new FileInputStream(file);BufferedInputStream bfs = new BufferedInputStream(fis);POIFSFileSystem pfsfs = new POIFSFileSystem(bfs);//创建一个workbook实体,然后将其赋值HSSFWorkbook workbook = new HSSFWorkbook(pfsfs);int numberOfSheets = workbook.getNumberOfSheets();System.out.println(numberOfSheets);for (int sheetOrder = 0; sheetOrder < numberOfSheets; sheetOrder++) {//Get the HSSFSheet object at the given index.HSSFSheet sheet = workbook.getSheetAt(sheetOrder);//Gets the number last row on the sheet.int lastRowIndex = sheet.getLastRowNum();System.out.println(lastRowIndex+"------------");for (int i = 0; i < lastRowIndex; i++) {HSSFRow row = sheet.getRow(i);if (row == null) {break;}short lastCellNum = row.getLastCellNum(); for (int j = 0; j < lastCellNum; j++) { if(row.getCell(j).getCellType() == 1) {//这里获取的数据类型为String行, String cellValue = row.getCell(j).getStringCellValue(); System.out.println(cellValue); }else if(row.getCell(j).getCellType() == 0) {//这里表示excel中的数据为number long numericCellValue = (long)row.getCell(j).getNumericCellValue(); System.out.println(numericCellValue); }else if(row.getCell(j).getCellType() == 3) {//这里表示excel中的数据为空 System.out.println(row.getCell(j)); } }}}bfs.close();fis.close();}public static void main(String[] args) throws FileNotFoundException, IOException {File file = new File("F:dsfadsa.xls");OperationExcel oe = new OperationExcel();oe.readExcelTest(file);}}
第四步:测试效果
输出结果:
第五步:注意事项
这里解析excel文件时,出现个情况,就是表格里面的数据如果是纯数字,它就会被解析成double型,所以在上面示例代码中,如果使用row.getCell(j).getStringCellValue()将其强转为String时,会报错。所以我将其转化为了long型,但是不能转化成int型,因为会出现溢出的情况,不过不是纯数字,就会就可以转化为String。
但是还有其他情况,比如我测试的时候,某一个表格为空的时候,这个时候就不能转化,因为转化了后直接获取不了这个表格的内容,但是我们要知道这个是为空的,所以需要先判断这个表格中这个值的类型,如果 row.getCell(j).getCellType() == 3 时,那就表明这个值为空,这个时候再根据其业务中表达的实际意义去处理这个相应的值。
当然,还有其它类型的,比如date类型,我发现api中也有返回这个类型的方法,不过我没有去试,如果实际工作中出现了这种数据,也需要好好测试下,然后再解析处理。
关于这个部分方法解析,可以参考这篇文章:
http://blog.csdn.net/vbirdbest/article/details/72870714
- Java中使用Apache POI使用解析excel文件
- 【Java】使用Apache POI生成和解析Excel文件
- java使用Apache POI操作excel文件
- java使用Apache POI操作excel文件
- Java使用Apache poi 导入Excel文件
- java使用poi解析Excel文件
- 使用Apache POI生成和解析Excel文件
- java中使用poi导入excel文件
- Java使用poi解析Excel
- Excel的解析--使用apache POI组件
- 使用Apache POI读写EXCEL文件
- 使用Apache POI读取Excel文件
- 使用 Apache POI读取EXCEL文件
- Apache POI解析Excel文件
- 使用POI解析excel文件方法总结
- 使用poi解析Excel
- 使用poi解析Excel
- 使用poi解析Excel
- Linux的初步学习(2)
- 多项式加法-->动态实现
- 1306求和
- 集合类
- LeetCode15. 3Sum
- Java中使用Apache POI使用解析excel文件
- poj 2406 Power Strings
- 任意输入一个年份,判断它是否是闰年。
- 中国剩余定理(详解)
- 习题5 5.3
- 216. Combination Sum III
- LeetCode18. 4Sum
- python3单行定义多个变量或赋值
- Installation guide for Kong custom plugins