计算本地Excel某两列的差异值

需求:分析一个D盘下的excel名字叫test.xlsx 文件内容A列数据比c列数据都多出那些数据,还要考虑重复出现的次数,比如 A列某个值出现5次,而 C列出现3次,那么也算"多出2个"。统计每个值在 A 和 C 中的出现次数,计算差值,输出差值>0的项及其多出的数量。

java 复制代码
package com.datalook.dao.dkyw;

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.*;

public class ExcelAnalyzer {


    public static void main(String[] args) {
        String filePath = "D:\\test.xlsx";

        try (FileInputStream fis = new FileInputStream(filePath);
             Workbook workbook = new XSSFWorkbook(fis)) {

            Sheet sheet = workbook.getSheetAt(0);
            if (sheet == null) {
                System.out.println("Excel中没有Sheet");
                return;
            }

            DataFormatter dataFormatter = new DataFormatter();

            Map<String, Integer> countA = new HashMap<>();
            Map<String, Integer> countC = new HashMap<>();

            for (Row row : sheet) {
                if (row == null) continue;

                Cell cellA = row.getCell(0);
                Cell cellC = row.getCell(2);

                String valA = cellA != null ? dataFormatter.formatCellValue(cellA).trim() : null;
                String valC = cellC != null ? dataFormatter.formatCellValue(cellC).trim() : null;

                if (valA != null && !valA.isEmpty()) {
                    countA.put(valA, countA.getOrDefault(valA, 0) + 1);
                }
                if (valC != null && !valC.isEmpty()) {
                    countC.put(valC, countC.getOrDefault(valC, 0) + 1);
                }
            }

            List<String> extraEntries = new ArrayList<>();

            for (Map.Entry<String, Integer> entry : countA.entrySet()) {
                String key = entry.getKey();
                int freqA = entry.getValue();
                int freqC = countC.getOrDefault(key, 0);
                int diff = freqA - freqC;
                if (diff > 0) {
                    for (int i = 0; i < diff; i++) {
                        extraEntries.add(key);
                    }
                }
            }

            System.out.println("A列比C列多出的数据(共 " + extraEntries.size() + " 条):");
            for (String val : extraEntries) {
                System.out.println("'" + val + "'");
            }

        } catch (IOException e) {
            System.err.println("读取Excel文件错误:" + e.getMessage());
            e.printStackTrace();
        }
    }


//    public static void main(String[] args) {
//        String filePath = "D:\\test.xlsx";
//
//        try (FileInputStream fis = new FileInputStream(filePath);
//             Workbook workbook = new XSSFWorkbook(fis)) {
//
//            Sheet sheet = workbook.getSheetAt(0); // 读取第一个sheet
//            if (sheet == null) {
//                System.out.println("Excel中没有Sheet");
//                return;
//            }
//
//            DataFormatter dataFormatter = new DataFormatter();
//
//            // 用于存放A列和C列的所有数据(去重)
//            Set<String> setA = new HashSet<>();
//            Set<String> setC = new HashSet<>();
//
//            // 读取所有行,跳过空行
//            for (Row row : sheet) {
//                if (row == null) continue;
//
//                // A列索引是0,C列索引是2
//                Cell cellA = row.getCell(0);
//                Cell cellC = row.getCell(2);
//
//                // 使用DataFormatter获取单元格字符串,避免数据格式问题
//                String valA = cellA != null ? dataFormatter.formatCellValue(cellA).trim() : null;
//                String valC = cellC != null ? dataFormatter.formatCellValue(cellC).trim() : null;
//
//                if (valA != null && !valA.isEmpty()) {
//                    setA.add(valA);
//                }
//                if (valC != null && !valC.isEmpty()) {
//                    setC.add(valC);
//                }
//            }
//
//            // 找出A列中但不在C列中的数据
//            Set<String> difference = new HashSet<>(setA);
//            difference.removeAll(setC);
//
//            System.out.println("A列比C列多出的数据如下:");
//            if (difference.isEmpty()) {
//                System.out.println("无多出数据");
//            } else {
//                difference.forEach(System.out::println);
//            }
//
//        } catch (IOException e) {
//            System.err.println("读取Excel文件时出错:" + e.getMessage());
//            e.printStackTrace();
//        }
//    }
}

控制台输出结果,不管有那些差异当前程序都能循环比对出来

相关推荐
过期的秋刀鱼!5 分钟前
用“做饭”理解数据分析流程(Excel三件套实战)
数据挖掘·数据分析·excel·powerbi·数据分析入门
挑战者66688836 分钟前
如何将Excel表的内容转化为json格式呢?
excel
干净的坏蛋41 分钟前
EasyExcel实现Excel复杂格式导出:合并单元格与样式设置实战
excel
张太行_10 天前
MySQL与Excel比较
数据库·mysql·excel
cwtlw10 天前
Excel学习03
笔记·学习·其他·excel
涔溪10 天前
实现 el-table 中键盘方向键导航功能vue2+vue3(类似 Excel)
前端·vue.js·excel
云博客-资源宝10 天前
Excel函数大全
机器学习·excel·概率论
BillKu11 天前
【前后前】导入Excel文件闭环模型:Vue3前端上传Excel文件,【Java后端接收、解析、返回数据】,Vue3前端接收展示数据
java·前端·excel