easyexcel读文件入批量入es

  1. 封装实体类,并对应excel表中的列

    @Data
    public class User {

    复制代码
     private String md5;
    
     private String id; 
     @ExcelProperty(value = "age")
     private String age;
     @ExcelProperty(value = "username")
     private String name;

    }

  2. 批量入库

    复制代码
    private void insertBatchToES(List<User> dataList, String indexName) {
         try {
             BulkProcessor bulkProcessor = BulkProcessor.builder(
                     (request, bulkListener) -> elasticsearchClient.bulkAsync(request, RequestOptions.DEFAULT, bulkListener),
                     new BulkProcessor.Listener() {
    
                         @Override
                         public void beforeBulk(long executionId, org.elasticsearch.action.bulk.BulkRequest request) {
                             // 准备执行前的操作
                         }
    
                         @Override
                         public void afterBulk(long executionId, org.elasticsearch.action.bulk.BulkRequest request, org.elasticsearch.action.bulk.BulkResponse response) {
                             if (response != null) {
                                 int insertedCount = request.numberOfActions(); // 获取请求中操作的数量,即插入的条数
                                 log.info("批量插入 " + insertedCount + " 条数据成功");
                             }
                         }
    
                         @Override
                         public void afterBulk(long executionId, org.elasticsearch.action.bulk.BulkRequest request, Throwable failure) {
                             log.info("批量插入 error");
                         }
                     })
                     // 设置每1000个请求执行一次批处理
                     .setBulkActions(500)
                     .build();
    
    
    
             for(User user : dataList) {
                 String jsonString = convertToJson(user);
                 IndexRequest indexRequest = new IndexRequest(indexName)
                         .id(user.getId())
                         .source(jsonString, XContentType.JSON);
                 bulkProcessor.add(indexRequest);
             }
             bulkProcessor.awaitClose(10, TimeUnit.MINUTES);
             bulkProcessor.close();
    
         } catch (InterruptedException | JsonProcessingException e) {
             e.printStackTrace();
         }
     } 

将对象转json工具类:

复制代码
 public String convertToJson(user) throws JsonProcessingException {
        String objStr = JSON.toJSONString(user, SerializerFeature.WriteNullListAsEmpty, SerializerFeature.WriteNullNumberAsZero,
                SerializerFeature.WriteNullStringAsEmpty, SerializerFeature.NotWriteDefaultValue);

        return objStr;
    }
  1. 读指定文件excel , 封装List

    public void importExcelToES(String excelFilePath, String indexName) {
    try {
    EasyExcel.read(excelFilePath, User.class, new AnalysisEventListener<User>() {
    private List<User> dataList = new ArrayList<>();

    复制代码
                 @Override
                 public void invoke(UserFansExcel data, AnalysisContext analysisContext) {
                     long id = generator.nextId();
                     data.setId(String.valueOf(id));
                   
                    
                     if (dataList.size() >= 500) {
                         insertBatchToES(filteredList, indexName);
                         dataList.clear();
                     }
                 }
    
                 @Override
                 public void doAfterAllAnalysed(AnalysisContext analysisContext) {
                     if (!dataList.isEmpty()) {
                         insertBatchToES(dataList, indexName);
                     }
                 }
             }).sheet().doRead();
         } catch (Exception e) {
             e.printStackTrace();
         }

3.1 读执行目录下的所有excel文件,这些文件的格式是一样的

复制代码
public void readExcelFilesFromDirectory(String directoryPath) throws IOException {
        List<User> dataList = new ArrayList<>();
        File dir = new File(directoryPath);
        File[] files = dir.listFiles((d, name) -> name.endsWith(".xlsx"));

        if (files != null) {
            for (File file : files) {
                System.out.println(file.getName());
                try {
                    String primaryUserId = file.getName().replace(".xlsx", "");
                    try (FileInputStream fis = new FileInputStream(file)) {
                        EasyExcel.read(fis, User.class, new AnalysisEventListener<User>() {


                            @Override
                            public void invoke(User data, AnalysisContext context) {
                                data.setName(primaryUserId);
                               
                                dataList.add(data);
                            }

                            @Override
                            public void doAfterAllAnalysed(AnalysisContext analysisContext) {

                            }



                        }).sheet().doRead();
                    }
                } catch (Exception e) {
                    e.printStackTrace();
                }

           if(dataList.size() >0){
              //这里可以插入数据库
               dataList.clear();
           }

            }
        }
        
    }
相关推荐
不知几秋4 分钟前
Maven
java·数据库·maven
jackson凌1 小时前
【Java学习笔记】equals方法
java·笔记·学习
TinpeaV1 小时前
websocket入门详解
java·网络·spring boot·websocket·网络协议
王有品1 小时前
Java 集合框架对比全解析:单列集合 vs 双列集合
java·windows·python
北漂老男孩1 小时前
ChromeDriver 技术生态与应用场景深度解析
java·爬虫·python·自动化
昔我往昔2 小时前
除了GC哪些地方有用到安全点
java·jvm·安全
wxin_VXbishe2 小时前
springboot旅游小程序-计算机毕业设计源码76696
java·spring boot·python·spring·django·sqlite·flask
我是Superman丶2 小时前
【Lua】java 调用redis执行 lua脚本
java·开发语言·junit
素雪风华2 小时前
构建RAG混合开发---PythonAI+JavaEE+Vue.js前端的实践
java·vue.js·python·ai·语言模型·llms·qwen千问大模型
zm2 小时前
服务器连接多客户端
java·javascript·算法