POI 和 easyExcel 的简介

    科技2022-07-15  121

    Java操作Excel的POI和easyExcel的学习与使用

    本文的代码已经同步到码云,码云地址

    在excel-demo模块里

    1.POI 和 easyExcel 的简介

    1.1Apache POI 简介

    Apache POI 官网:https://poi.apache.org/

    主要功能:

    1.2easyExcel 简介

    easyExcel 官网地址:https://github.com/alibaba/easyexcel

    官方文档地址:https://www.yuque.com/easyexcel/doc/easyexcel

    EasyExcel 是阿里巴巴开源的一个excel处理框架,以使用简单、节省内存著称。

    EasyExcel 能大大减少占用内存的主要原因是在解析 Excel 时没有将文件数据一次性全部加载到内存中,而是从磁盘上一行行读取数据,逐个解析。

    这是 EasyExcel 和 POI 在解析Excel时的对比图。

    2.Apache POI 的基本使用

    需要知道使用excel中的几个名词

    1、工作簿: Workbook

    2、工作表: Sheet

    3、行: Row

    4、列: Cell

    2.1 写入操作

    新建maven项目,引入依赖

    <dependencies> <!--xls(03)--> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>3.9</version> </dependency> <!--xlsx(07)--> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.9</version> </dependency> <!--日期格式化工具--> <dependency> <groupId>joda-time</groupId> <artifactId>joda-time</artifactId> <version>2.10.1</version> </dependency> <!--test--> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.12</version> </dependency> </dependencies>

    编写测试类

    package com.njit.poi; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import org.joda.time.DateTime; import java.io.FileOutputStream; import java.io.IOException; /** * @Author: njitzyd * @Date: 2020/10/3 16:50 * @Description: PoiWrite * @Version 1.0.0 */ public class PoiWrite { private static final String PATH = "D:\\IDEAWorkSpace\\JavaDemoCollection\\excel-demo/"; public static void main(String[] args) throws IOException { // // 1、创建一个工作簿 // Workbook workbook = new HSSFWorkbook(); // // 2、创建一个工作表 // Sheet sheet = workbook.createSheet("03版本的表"); // // 3、创建一个行 (1,1) // Row row1 = sheet.createRow(0); // // 4、创建一个单元格 // Cell cell11 = row1.createCell(0); // cell11.setCellValue("第一个单元格"); // // (1,2) // Cell cell12 = row1.createCell(1); // cell12.setCellValue(666); // // // 第二行 (2,1) // Row row2 = sheet.createRow(1); // Cell cell21 = row2.createCell(0); // cell21.setCellValue("第二个单元格"); // // (2,2) // Cell cell22 = row2.createCell(1); // String time = new DateTime().toString("yyyy-MM-dd HH:mm:ss"); // cell22.setCellValue(time); // // // 生成一张表(IO 流) 03 版本就是使用 xls结尾! // FileOutputStream fileOutputStream = new FileOutputStream(PATH + "这是03版本的表格.xls"); // // 输出 // workbook.write(fileOutputStream); // // 关闭流 // fileOutputStream.close(); // // System.out.println("03版本的表格生成完毕!"); // 下面是07版本的表格 你可以发现基本不变,只是工作簿对象和生成的文件结尾不一样,其他不用改变 // 1、创建一个工作簿 Workbook workbook = new XSSFWorkbook(); // 2、创建一个工作表 Sheet sheet = workbook.createSheet("03版本的表"); // 3、创建一个行 (1,1) Row row1 = sheet.createRow(0); // 4、创建一个单元格 Cell cell11 = row1.createCell(0); cell11.setCellValue("第一个单元格"); // (1,2) Cell cell12 = row1.createCell(1); cell12.setCellValue(666); // 第二行 (2,1) Row row2 = sheet.createRow(1); Cell cell21 = row2.createCell(0); cell21.setCellValue("第二个单元格"); // (2,2) Cell cell22 = row2.createCell(1); String time = new DateTime().toString("yyyy-MM-dd HH:mm:ss"); cell22.setCellValue(time); // 生成一张表(IO 流) 07 版本就是使用 xlsx结尾! FileOutputStream fileOutputStream = new FileOutputStream(PATH + "这是07版本的表格.xlsx"); // 输出 workbook.write(fileOutputStream); // 关闭流 fileOutputStream.close(); System.out.println("07版本的表格生成完毕!"); } }

    2.2 大文件写HSSF

    缺点:最多只能处理65536行,否则会抛出异常java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0..65535)

    优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快

    public static void main(String[] args) throws IOException { // 第一种方式 写入03版本 // 时间 long begin = System.currentTimeMillis(); // 创建一个薄 Workbook workbook = new HSSFWorkbook(); // 创建表 Sheet sheet = workbook.createSheet(); // 写入数据 for (int rowNum = 0; rowNum < 65537; rowNum++) { Row row = sheet.createRow(rowNum); for (int cellNum = 0; cellNum < 10 ; cellNum++) { Cell cell = row.createCell(cellNum); cell.setCellValue(cellNum); } } System.out.println("传入03版本成功"); FileOutputStream outputStream = new FileOutputStream(PATH + "testWrite03BigData.xls"); workbook.write(outputStream); outputStream.close(); long end = System.currentTimeMillis(); System.out.println((double) (end-begin)/1000); }

    2.3大文件写XSSF

    缺点:写数据时速度非常慢,非常耗内存,也会发生内存溢出,如100万条

    优点:可以写较大的数据量,如20万条

    public static void main(String[] args) throws IOException { // 第二种方式 写入07版本XSSF // 时间 long begin = System.currentTimeMillis(); // 创建一个薄 Workbook workbook = new XSSFWorkbook(); // 创建表 Sheet sheet = workbook.createSheet(); // 写入数据 for (int rowNum = 0; rowNum < 100000; rowNum++) { Row row = sheet.createRow(rowNum); for (int cellNum = 0; cellNum < 10 ; cellNum++) { Cell cell = row.createCell(cellNum); cell.setCellValue(cellNum); } } System.out.println("over"); FileOutputStream outputStream = new FileOutputStream(PATH + "testWrite07BigData.xlsx"); workbook.write(outputStream); outputStream.close(); long end = System.currentTimeMillis(); System.out.println((double) (end-begin)/1000); }

    2.4 大文件写SXSSF

    优点:可以写非常大的数据量,如100万条甚至更多条,写数据速度快,占用更少的内存

    注意:

    过程中会产生临时文件,需要清理临时文件

    默认由100条记录被保存在内存中,如果超过这数量,则最前面的数据被写入临时文件

    如果想自定义内存中数据的数量,可以使用new SXSSFWorkbook ( 数量 )

    public static void main(String[] args) throws IOException { long begin = System.currentTimeMillis(); // 创建一个工作簿 Workbook workbook = new SXSSFWorkbook(); // 创建表 Sheet sheet = workbook.createSheet(); // 写入数据 for (int rowNum = 0; rowNum < 100000; rowNum++) { Row row = sheet.createRow(rowNum); for (int cellNum = 0; cellNum < 10 ; cellNum++) { Cell cell = row.createCell(cellNum); cell.setCellValue(cellNum); } } System.out.println("over"); FileOutputStream outputStream = new FileOutputStream(PATH + "testWrite07BigDataS.xlsx"); workbook.write(outputStream); outputStream.close(); // 清除临时文件! ((SXSSFWorkbook) workbook).dispose(); long end = System.currentTimeMillis(); System.out.println((double) (end-begin)/1000); }

    SXSSFWorkbook-来至官方的解释:实现“BigGridDemo”策略的流式XSSFWorkbook版本。这允许写入非常大的文件而不会耗尽内存,因为任何时候只有可配置的行部分被保存在内存中。

    请注意,仍然可能会消耗大量内存,这些内存基于您正在使用的功能,例如合并区域,注释…仍然只存储在内存中,因此如果广泛使用,可能需要大量内存。

    2.5 读取基本操作

    读取的时候需要注意获取值的类型即可

    public static void main(String[] args) throws IOException { // 03版本 // 获取文件流 FileInputStream inputStream = new FileInputStream(PATH + "这是03版本的表格.xls"); // 1、创建一个工作簿。 使用excel能操作的这边他都可以操作! Workbook workbook = new HSSFWorkbook(inputStream); // 2、得到表 Sheet sheet = workbook.getSheetAt(0); // 3、得到行 Row row = sheet.getRow(0); // 4、得到列 Cell cell = row.getCell(1); // 读取值的时候,一定需要注意类型! // getStringCellValue 字符串类型 System.out.println(cell.getStringCellValue()); System.out.println(cell.getNumericCellValue()); inputStream.close(); // // 07 版本 // // 获取文件流 // FileInputStream inputStream = new FileInputStream(PATH + "这是07版本的表格.xlsx"); // // // 1、创建一个工作簿。 使用excel能操作的这边他都可以操作! // Workbook workbook = new XSSFWorkbook(inputStream); // // 2、得到表 // Sheet sheet = workbook.getSheetAt(0); // // 3、得到行 // Row row = sheet.getRow(0); // // 4、得到列 // Cell cell = row.getCell(1); // // // 读取值的时候,一定需要注意类型! // // getStringCellValue 字符串类型 // // System.out.println(cell.getStringCellValue()); // System.out.println(cell.getNumericCellValue()); // inputStream.close(); }

    2.6 读取不同的数据类型

    // 这里只进行一种演示,03和07 的差别和其他地方一样处理就好,只是很细微的改变,使用方法是相同的 public class PoiReadDiffType { private static final String PATH = "D:/IDEAWorkSpace/JavaDemoCollection/excel-demo/"; public static void main(String[] args) throws IOException { // 获取文件流 FileInputStream inputStream = new FileInputStream(PATH + "会员消费商品明细表.xls"); // 创建一个工作簿。 使用excel能操作的这边他都可以操作! Workbook workbook = new HSSFWorkbook(inputStream); Sheet sheet = workbook.getSheetAt(0); // 获取标题内容 Row rowTitle = sheet.getRow(0); if (rowTitle!=null) { // 一定要掌握 int cellCount = rowTitle.getPhysicalNumberOfCells(); for (int cellNum = 0; cellNum < cellCount; cellNum++) { Cell cell = rowTitle.getCell(cellNum); if (cell!=null){ int cellType = cell.getCellType(); String cellValue = cell.getStringCellValue(); System.out.print(cellValue + " | "); } } System.out.println(); } // 获取表中的内容 int rowCount = sheet.getPhysicalNumberOfRows(); for (int rowNum = 1; rowNum < rowCount ; rowNum++) { Row rowData = sheet.getRow(rowNum); if (rowData!=null){ // 读取列 int cellCount = rowData.getPhysicalNumberOfCells(); for (int cellNum = 0; cellNum < cellCount ; cellNum++) { System.out.print("[" +(rowNum+1) + "-" + (cellNum+1) + "]"); Cell cell = rowData.getCell(cellNum); // 匹配列的数据类型 if (cell!=null) { int cellType = cell.getCellType(); String cellValue = ""; switch (cellType) { // 字符串 case HSSFCell.CELL_TYPE_STRING: System.out.print("【String】"); cellValue = cell.getStringCellValue(); break; // 布尔 case HSSFCell.CELL_TYPE_BOOLEAN: System.out.print("【BOOLEAN】"); cellValue = String.valueOf(cell.getBooleanCellValue()); break; // 空 case HSSFCell.CELL_TYPE_BLANK: System.out.print("【BLANK】"); break; // 数字(日期、普通数字) case HSSFCell.CELL_TYPE_NUMERIC: System.out.print("【NUMERIC】"); // 日期 if (HSSFDateUtil.isCellDateFormatted(cell)){ System.out.print("【日期】"); Date date = cell.getDateCellValue(); cellValue = new DateTime(date).toString("yyyy-MM-dd"); }else { // 不是日期格式,防止数字过长! System.out.print("【转换为字符串输出】"); cell.setCellType(HSSFCell.CELL_TYPE_STRING); cellValue = cell.toString(); } break; case HSSFCell.CELL_TYPE_ERROR: System.out.print("【数据类型错误】"); break; } System.out.println(cellValue); } } } } inputStream.close(); } }

    2.7 excel的计算公式(了解)

    public class Formlua { private static final String PATH = "D:/IDEAWorkSpace/JavaDemoCollection/excel-demo/"; public static void main(String[] args) throws FileNotFoundException { FileInputStream inputStream = new FileInputStream(PATH + "计算公式.xls"); Workbook workbook = new HSSFWorkbook(inputStream); Sheet sheet = workbook.getSheetAt(0); Row row = sheet.getRow(4); Cell cell = row.getCell(0); // 拿到计算公式 eval FormulaEvaluator FormulaEvaluator = new HSSFFormulaEvaluator((HSSFWorkbook)workbook); // 输出单元格的内容 int cellType = cell.getCellType(); switch (cellType){ // 公式 case Cell.CELL_TYPE_FORMULA: String formula = cell.getCellFormula(); System.out.println(formula); // 计算 CellValue evaluate = FormulaEvaluator.evaluate(cell); String cellValue = evaluate.formatAsString(); System.out.println(cellValue); break; } } }

    3.EasyExcel的使用

    导入依赖

    <dependency> <groupId>com.alibaba</groupId> <artifactId>easyexcel</artifactId> <version>2.2.3</version> </dependency>

    新建一个实体类

    easyExcel可以根据这个实体类去生成表

    @Data public class DemoData { @ExcelProperty("字符串标题") private String string; @ExcelProperty("日期标题") private Date date; @ExcelProperty("数字标题") private Double doubleData; /** * 忽略这个字段 */ @ExcelIgnore private String ignore; } 官方的案例代码 private List<DemoData> data() { List<DemoData> list = new ArrayList<DemoData>(); for (int i = 0; i < 10; i++) { DemoData data = new DemoData(); data.setString("字符串" + i); data.setDate(new Date()); data.setDoubleData(0.56); list.add(data); } return list; } 写入案例 // 根据list 写入excel public void simpleWrite() { // 写法1 String fileName = PATH + "EasyTest.xlsx"; // 这里 需要指定写用哪个class去写,然后写到第一个sheet,名字为模板 然后文件流会自动关闭 // write (fileName, 格式类) // sheet (表名) // doWrite (数据) EasyExcel.write(fileName, DemoData.class).sheet("模板").doWrite(data()); } 读取案例 // 先写一个持久层,如果需要的话 /** * 假设这个是你的DAO存储。当然还要这个类让spring管理,当然你不用需要存储,也不需要这个类。 **/ public class DemoDAO { public void save(List<DemoData> list) { // 持久化操作! // 如果是mybatis,尽量别直接调用多次insert,自己写一个mapper里面新增一个方法batchInsert,所有数据一次性插入 } } // 有个很重要的点 DemoDataListener 不能被spring管理,要每次读取excel都要new,然后里面用到spring可以构造方法传进去 public class DemoDataListener extends AnalysisEventListener<DemoData> { private static final Logger LOGGER = LoggerFactory.getLogger(DemoDataListener.class); private static final int BATCH_COUNT = 5; List<DemoData> list = new ArrayList<DemoData>(); private DemoDAO demoDAO; public DemoDataListener() { // 这里是demo,所以随便new一个。实际使用如果到了spring,请使用下面的有参构造函数 demoDAO = new DemoDAO(); } public DemoDataListener(DemoDAO demoDAO) { this.demoDAO = demoDAO; } // 读取数据会执行 invoke 方法 // DemoData 类型 // AnalysisContext 分析上问 @Override public void invoke(DemoData data, AnalysisContext context) { System.out.println(JSON.toJSONString(data)); list.add(data); // 达到BATCH_COUNT了,需要去存储一次数据库,防止数据几万条数据在内存,容易OOM if (list.size() >= BATCH_COUNT) { saveData(); // 持久化逻辑! // 存储完成清理 list list.clear(); } } /** * 所有数据解析完成了 都会来调用 * * @param context */ @Override public void doAfterAllAnalysed(AnalysisContext context) { // 这里也要保存数据,确保最后遗留的数据也存储到数据库 saveData(); LOGGER.info("所有数据解析完成!"); } /** * 加上存储数据库 */ private void saveData() { LOGGER.info("{}条数据,开始存储数据库!", list.size()); demoDAO.save(list); LOGGER.info("存储数据库成功!"); } } // 最后的读取方法 public void simpleRead() { // 有个很重要的点 DemoDataListener 不能被spring管理,要每次读取excel都要new,然后里面用到spring可以构造方法传进去 // 写法1: String fileName = PATH + "EasyTest.xlsx"; // 这里 需要指定读用哪个class去读,然后读取第一个sheet 文件流会自动关闭 // 重点注意读取的逻辑 DemoDataListener EasyExcel.read(fileName, DemoData.class, new DemoDataListener()).sheet().doRead(); }

    固定套路:

    1、写入,固定类格式进行写入

    2、读取,根据监听器设置的规则进行读取!

    更复杂的可以直接看官方的文档,很清晰!

    Processed: 0.014, SQL: 8