Java操作Excel的POI和easyExcel的学习与使用
本文的代码已经同步到码云,码云地址
在excel-demo模块里
Apache POI 官网:https://poi.apache.org/
主要功能:
easyExcel 官网地址:https://github.com/alibaba/easyexcel
官方文档地址:https://www.yuque.com/easyexcel/doc/easyexcel
EasyExcel 是阿里巴巴开源的一个excel处理框架,以使用简单、节省内存著称。
EasyExcel 能大大减少占用内存的主要原因是在解析 Excel 时没有将文件数据一次性全部加载到内存中,而是从磁盘上一行行读取数据,逐个解析。
这是 EasyExcel 和 POI 在解析Excel时的对比图。
需要知道使用excel中的几个名词
1、工作簿: Workbook
2、工作表: Sheet
3、行: Row
4、列: Cell
新建maven项目,引入依赖
<dependencies> <!--xls(03)--> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>3.9</version> </dependency> <!--xlsx(07)--> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.9</version> </dependency> <!--日期格式化工具--> <dependency> <groupId>joda-time</groupId> <artifactId>joda-time</artifactId> <version>2.10.1</version> </dependency> <!--test--> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.12</version> </dependency> </dependencies>编写测试类
package com.njit.poi; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import org.joda.time.DateTime; import java.io.FileOutputStream; import java.io.IOException; /** * @Author: njitzyd * @Date: 2020/10/3 16:50 * @Description: PoiWrite * @Version 1.0.0 */ public class PoiWrite { private static final String PATH = "D:\\IDEAWorkSpace\\JavaDemoCollection\\excel-demo/"; public static void main(String[] args) throws IOException { // // 1、创建一个工作簿 // Workbook workbook = new HSSFWorkbook(); // // 2、创建一个工作表 // Sheet sheet = workbook.createSheet("03版本的表"); // // 3、创建一个行 (1,1) // Row row1 = sheet.createRow(0); // // 4、创建一个单元格 // Cell cell11 = row1.createCell(0); // cell11.setCellValue("第一个单元格"); // // (1,2) // Cell cell12 = row1.createCell(1); // cell12.setCellValue(666); // // // 第二行 (2,1) // Row row2 = sheet.createRow(1); // Cell cell21 = row2.createCell(0); // cell21.setCellValue("第二个单元格"); // // (2,2) // Cell cell22 = row2.createCell(1); // String time = new DateTime().toString("yyyy-MM-dd HH:mm:ss"); // cell22.setCellValue(time); // // // 生成一张表(IO 流) 03 版本就是使用 xls结尾! // FileOutputStream fileOutputStream = new FileOutputStream(PATH + "这是03版本的表格.xls"); // // 输出 // workbook.write(fileOutputStream); // // 关闭流 // fileOutputStream.close(); // // System.out.println("03版本的表格生成完毕!"); // 下面是07版本的表格 你可以发现基本不变,只是工作簿对象和生成的文件结尾不一样,其他不用改变 // 1、创建一个工作簿 Workbook workbook = new XSSFWorkbook(); // 2、创建一个工作表 Sheet sheet = workbook.createSheet("03版本的表"); // 3、创建一个行 (1,1) Row row1 = sheet.createRow(0); // 4、创建一个单元格 Cell cell11 = row1.createCell(0); cell11.setCellValue("第一个单元格"); // (1,2) Cell cell12 = row1.createCell(1); cell12.setCellValue(666); // 第二行 (2,1) Row row2 = sheet.createRow(1); Cell cell21 = row2.createCell(0); cell21.setCellValue("第二个单元格"); // (2,2) Cell cell22 = row2.createCell(1); String time = new DateTime().toString("yyyy-MM-dd HH:mm:ss"); cell22.setCellValue(time); // 生成一张表(IO 流) 07 版本就是使用 xlsx结尾! FileOutputStream fileOutputStream = new FileOutputStream(PATH + "这是07版本的表格.xlsx"); // 输出 workbook.write(fileOutputStream); // 关闭流 fileOutputStream.close(); System.out.println("07版本的表格生成完毕!"); } }缺点:最多只能处理65536行,否则会抛出异常java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0..65535)
优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快
public static void main(String[] args) throws IOException { // 第一种方式 写入03版本 // 时间 long begin = System.currentTimeMillis(); // 创建一个薄 Workbook workbook = new HSSFWorkbook(); // 创建表 Sheet sheet = workbook.createSheet(); // 写入数据 for (int rowNum = 0; rowNum < 65537; rowNum++) { Row row = sheet.createRow(rowNum); for (int cellNum = 0; cellNum < 10 ; cellNum++) { Cell cell = row.createCell(cellNum); cell.setCellValue(cellNum); } } System.out.println("传入03版本成功"); FileOutputStream outputStream = new FileOutputStream(PATH + "testWrite03BigData.xls"); workbook.write(outputStream); outputStream.close(); long end = System.currentTimeMillis(); System.out.println((double) (end-begin)/1000); }缺点:写数据时速度非常慢,非常耗内存,也会发生内存溢出,如100万条
优点:可以写较大的数据量,如20万条
public static void main(String[] args) throws IOException { // 第二种方式 写入07版本XSSF // 时间 long begin = System.currentTimeMillis(); // 创建一个薄 Workbook workbook = new XSSFWorkbook(); // 创建表 Sheet sheet = workbook.createSheet(); // 写入数据 for (int rowNum = 0; rowNum < 100000; rowNum++) { Row row = sheet.createRow(rowNum); for (int cellNum = 0; cellNum < 10 ; cellNum++) { Cell cell = row.createCell(cellNum); cell.setCellValue(cellNum); } } System.out.println("over"); FileOutputStream outputStream = new FileOutputStream(PATH + "testWrite07BigData.xlsx"); workbook.write(outputStream); outputStream.close(); long end = System.currentTimeMillis(); System.out.println((double) (end-begin)/1000); }优点:可以写非常大的数据量,如100万条甚至更多条,写数据速度快,占用更少的内存
注意:
过程中会产生临时文件,需要清理临时文件
默认由100条记录被保存在内存中,如果超过这数量,则最前面的数据被写入临时文件
如果想自定义内存中数据的数量,可以使用new SXSSFWorkbook ( 数量 )
public static void main(String[] args) throws IOException { long begin = System.currentTimeMillis(); // 创建一个工作簿 Workbook workbook = new SXSSFWorkbook(); // 创建表 Sheet sheet = workbook.createSheet(); // 写入数据 for (int rowNum = 0; rowNum < 100000; rowNum++) { Row row = sheet.createRow(rowNum); for (int cellNum = 0; cellNum < 10 ; cellNum++) { Cell cell = row.createCell(cellNum); cell.setCellValue(cellNum); } } System.out.println("over"); FileOutputStream outputStream = new FileOutputStream(PATH + "testWrite07BigDataS.xlsx"); workbook.write(outputStream); outputStream.close(); // 清除临时文件! ((SXSSFWorkbook) workbook).dispose(); long end = System.currentTimeMillis(); System.out.println((double) (end-begin)/1000); }SXSSFWorkbook-来至官方的解释:实现“BigGridDemo”策略的流式XSSFWorkbook版本。这允许写入非常大的文件而不会耗尽内存,因为任何时候只有可配置的行部分被保存在内存中。
请注意,仍然可能会消耗大量内存,这些内存基于您正在使用的功能,例如合并区域,注释…仍然只存储在内存中,因此如果广泛使用,可能需要大量内存。
读取的时候需要注意获取值的类型即可
public static void main(String[] args) throws IOException { // 03版本 // 获取文件流 FileInputStream inputStream = new FileInputStream(PATH + "这是03版本的表格.xls"); // 1、创建一个工作簿。 使用excel能操作的这边他都可以操作! Workbook workbook = new HSSFWorkbook(inputStream); // 2、得到表 Sheet sheet = workbook.getSheetAt(0); // 3、得到行 Row row = sheet.getRow(0); // 4、得到列 Cell cell = row.getCell(1); // 读取值的时候,一定需要注意类型! // getStringCellValue 字符串类型 System.out.println(cell.getStringCellValue()); System.out.println(cell.getNumericCellValue()); inputStream.close(); // // 07 版本 // // 获取文件流 // FileInputStream inputStream = new FileInputStream(PATH + "这是07版本的表格.xlsx"); // // // 1、创建一个工作簿。 使用excel能操作的这边他都可以操作! // Workbook workbook = new XSSFWorkbook(inputStream); // // 2、得到表 // Sheet sheet = workbook.getSheetAt(0); // // 3、得到行 // Row row = sheet.getRow(0); // // 4、得到列 // Cell cell = row.getCell(1); // // // 读取值的时候,一定需要注意类型! // // getStringCellValue 字符串类型 // // System.out.println(cell.getStringCellValue()); // System.out.println(cell.getNumericCellValue()); // inputStream.close(); }导入依赖
<dependency> <groupId>com.alibaba</groupId> <artifactId>easyexcel</artifactId> <version>2.2.3</version> </dependency>新建一个实体类
easyExcel可以根据这个实体类去生成表
@Data public class DemoData { @ExcelProperty("字符串标题") private String string; @ExcelProperty("日期标题") private Date date; @ExcelProperty("数字标题") private Double doubleData; /** * 忽略这个字段 */ @ExcelIgnore private String ignore; } 官方的案例代码 private List<DemoData> data() { List<DemoData> list = new ArrayList<DemoData>(); for (int i = 0; i < 10; i++) { DemoData data = new DemoData(); data.setString("字符串" + i); data.setDate(new Date()); data.setDoubleData(0.56); list.add(data); } return list; } 写入案例 // 根据list 写入excel public void simpleWrite() { // 写法1 String fileName = PATH + "EasyTest.xlsx"; // 这里 需要指定写用哪个class去写,然后写到第一个sheet,名字为模板 然后文件流会自动关闭 // write (fileName, 格式类) // sheet (表名) // doWrite (数据) EasyExcel.write(fileName, DemoData.class).sheet("模板").doWrite(data()); } 读取案例 // 先写一个持久层,如果需要的话 /** * 假设这个是你的DAO存储。当然还要这个类让spring管理,当然你不用需要存储,也不需要这个类。 **/ public class DemoDAO { public void save(List<DemoData> list) { // 持久化操作! // 如果是mybatis,尽量别直接调用多次insert,自己写一个mapper里面新增一个方法batchInsert,所有数据一次性插入 } } // 有个很重要的点 DemoDataListener 不能被spring管理,要每次读取excel都要new,然后里面用到spring可以构造方法传进去 public class DemoDataListener extends AnalysisEventListener<DemoData> { private static final Logger LOGGER = LoggerFactory.getLogger(DemoDataListener.class); private static final int BATCH_COUNT = 5; List<DemoData> list = new ArrayList<DemoData>(); private DemoDAO demoDAO; public DemoDataListener() { // 这里是demo,所以随便new一个。实际使用如果到了spring,请使用下面的有参构造函数 demoDAO = new DemoDAO(); } public DemoDataListener(DemoDAO demoDAO) { this.demoDAO = demoDAO; } // 读取数据会执行 invoke 方法 // DemoData 类型 // AnalysisContext 分析上问 @Override public void invoke(DemoData data, AnalysisContext context) { System.out.println(JSON.toJSONString(data)); list.add(data); // 达到BATCH_COUNT了,需要去存储一次数据库,防止数据几万条数据在内存,容易OOM if (list.size() >= BATCH_COUNT) { saveData(); // 持久化逻辑! // 存储完成清理 list list.clear(); } } /** * 所有数据解析完成了 都会来调用 * * @param context */ @Override public void doAfterAllAnalysed(AnalysisContext context) { // 这里也要保存数据,确保最后遗留的数据也存储到数据库 saveData(); LOGGER.info("所有数据解析完成!"); } /** * 加上存储数据库 */ private void saveData() { LOGGER.info("{}条数据,开始存储数据库!", list.size()); demoDAO.save(list); LOGGER.info("存储数据库成功!"); } } // 最后的读取方法 public void simpleRead() { // 有个很重要的点 DemoDataListener 不能被spring管理,要每次读取excel都要new,然后里面用到spring可以构造方法传进去 // 写法1: String fileName = PATH + "EasyTest.xlsx"; // 这里 需要指定读用哪个class去读,然后读取第一个sheet 文件流会自动关闭 // 重点注意读取的逻辑 DemoDataListener EasyExcel.read(fileName, DemoData.class, new DemoDataListener()).sheet().doRead(); }固定套路:
1、写入,固定类格式进行写入
2、读取,根据监听器设置的规则进行读取!
更复杂的可以直接看官方的文档,很清晰!