计算本地Excel某两列的差异值

需求:分析一个D盘下的excel名字叫test.xlsx 文件内容A列数据比c列数据都多出那些数据,还要考虑重复出现的次数,比如 A列某个值出现5次,而 C列出现3次,那么也算"多出2个"。统计每个值在 A 和 C 中的出现次数,计算差值,输出差值>0的项及其多出的数量。

java 复制代码
package com.datalook.dao.dkyw;

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.*;

public class ExcelAnalyzer {


    public static void main(String[] args) {
        String filePath = "D:\\test.xlsx";

        try (FileInputStream fis = new FileInputStream(filePath);
             Workbook workbook = new XSSFWorkbook(fis)) {

            Sheet sheet = workbook.getSheetAt(0);
            if (sheet == null) {
                System.out.println("Excel中没有Sheet");
                return;
            }

            DataFormatter dataFormatter = new DataFormatter();

            Map<String, Integer> countA = new HashMap<>();
            Map<String, Integer> countC = new HashMap<>();

            for (Row row : sheet) {
                if (row == null) continue;

                Cell cellA = row.getCell(0);
                Cell cellC = row.getCell(2);

                String valA = cellA != null ? dataFormatter.formatCellValue(cellA).trim() : null;
                String valC = cellC != null ? dataFormatter.formatCellValue(cellC).trim() : null;

                if (valA != null && !valA.isEmpty()) {
                    countA.put(valA, countA.getOrDefault(valA, 0) + 1);
                }
                if (valC != null && !valC.isEmpty()) {
                    countC.put(valC, countC.getOrDefault(valC, 0) + 1);
                }
            }

            List<String> extraEntries = new ArrayList<>();

            for (Map.Entry<String, Integer> entry : countA.entrySet()) {
                String key = entry.getKey();
                int freqA = entry.getValue();
                int freqC = countC.getOrDefault(key, 0);
                int diff = freqA - freqC;
                if (diff > 0) {
                    for (int i = 0; i < diff; i++) {
                        extraEntries.add(key);
                    }
                }
            }

            System.out.println("A列比C列多出的数据(共 " + extraEntries.size() + " 条):");
            for (String val : extraEntries) {
                System.out.println("'" + val + "'");
            }

        } catch (IOException e) {
            System.err.println("读取Excel文件错误:" + e.getMessage());
            e.printStackTrace();
        }
    }


//    public static void main(String[] args) {
//        String filePath = "D:\\test.xlsx";
//
//        try (FileInputStream fis = new FileInputStream(filePath);
//             Workbook workbook = new XSSFWorkbook(fis)) {
//
//            Sheet sheet = workbook.getSheetAt(0); // 读取第一个sheet
//            if (sheet == null) {
//                System.out.println("Excel中没有Sheet");
//                return;
//            }
//
//            DataFormatter dataFormatter = new DataFormatter();
//
//            // 用于存放A列和C列的所有数据(去重)
//            Set<String> setA = new HashSet<>();
//            Set<String> setC = new HashSet<>();
//
//            // 读取所有行,跳过空行
//            for (Row row : sheet) {
//                if (row == null) continue;
//
//                // A列索引是0,C列索引是2
//                Cell cellA = row.getCell(0);
//                Cell cellC = row.getCell(2);
//
//                // 使用DataFormatter获取单元格字符串,避免数据格式问题
//                String valA = cellA != null ? dataFormatter.formatCellValue(cellA).trim() : null;
//                String valC = cellC != null ? dataFormatter.formatCellValue(cellC).trim() : null;
//
//                if (valA != null && !valA.isEmpty()) {
//                    setA.add(valA);
//                }
//                if (valC != null && !valC.isEmpty()) {
//                    setC.add(valC);
//                }
//            }
//
//            // 找出A列中但不在C列中的数据
//            Set<String> difference = new HashSet<>(setA);
//            difference.removeAll(setC);
//
//            System.out.println("A列比C列多出的数据如下:");
//            if (difference.isEmpty()) {
//                System.out.println("无多出数据");
//            } else {
//                difference.forEach(System.out::println);
//            }
//
//        } catch (IOException e) {
//            System.err.println("读取Excel文件时出错:" + e.getMessage());
//            e.printStackTrace();
//        }
//    }
}

控制台输出结果,不管有那些差异当前程序都能循环比对出来

相关推荐
JoshRen16 小时前
2026教程:上传Excel,用Gemini 3镜像站多模态一键生成问卷分析图表代码与结论(附国内免费方案)
excel
实战编程2 天前
Temu 插件导出 Excel 图片问题总结(SheetJS / ExcelJS)
excel
Data-Miner2 天前
用DeepSeek V4做表:数以轻舟Agent让做Excel表像聊天一样简单
microsoft·excel
Eiceblue3 天前
使用 C# 将 Excel 转换为 Markdown 表格(含批量转换示例)
开发语言·c#·excel
Java面试题总结3 天前
使用 Python 设置 Excel 数据验证
开发语言·python·excel
追逐梦想永不停3 天前
记录一个好用的excel判断数字格式的公式
前端·chrome·excel
Eiceblue3 天前
C# 如何实现 Word 转 Excel ?分享两种实用方法
c#·word·excel
CircleMouse4 天前
如何设置wps单元格下拉选项设置
excel·wps
zhangjin12224 天前
kettle插件-excel插件,kettle读取excel动态表头,kettle根据列名读取excel
excel·kettle·kettle excel插件·kettle 动态excel
远洪4 天前
excel 找出两列不同的数据
excel