计算本地Excel某两列的差异值

需求:分析一个D盘下的excel名字叫test.xlsx 文件内容A列数据比c列数据都多出那些数据,还要考虑重复出现的次数,比如 A列某个值出现5次,而 C列出现3次,那么也算"多出2个"。统计每个值在 A 和 C 中的出现次数,计算差值,输出差值>0的项及其多出的数量。

java 复制代码
package com.datalook.dao.dkyw;

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.*;

public class ExcelAnalyzer {


    public static void main(String[] args) {
        String filePath = "D:\\test.xlsx";

        try (FileInputStream fis = new FileInputStream(filePath);
             Workbook workbook = new XSSFWorkbook(fis)) {

            Sheet sheet = workbook.getSheetAt(0);
            if (sheet == null) {
                System.out.println("Excel中没有Sheet");
                return;
            }

            DataFormatter dataFormatter = new DataFormatter();

            Map<String, Integer> countA = new HashMap<>();
            Map<String, Integer> countC = new HashMap<>();

            for (Row row : sheet) {
                if (row == null) continue;

                Cell cellA = row.getCell(0);
                Cell cellC = row.getCell(2);

                String valA = cellA != null ? dataFormatter.formatCellValue(cellA).trim() : null;
                String valC = cellC != null ? dataFormatter.formatCellValue(cellC).trim() : null;

                if (valA != null && !valA.isEmpty()) {
                    countA.put(valA, countA.getOrDefault(valA, 0) + 1);
                }
                if (valC != null && !valC.isEmpty()) {
                    countC.put(valC, countC.getOrDefault(valC, 0) + 1);
                }
            }

            List<String> extraEntries = new ArrayList<>();

            for (Map.Entry<String, Integer> entry : countA.entrySet()) {
                String key = entry.getKey();
                int freqA = entry.getValue();
                int freqC = countC.getOrDefault(key, 0);
                int diff = freqA - freqC;
                if (diff > 0) {
                    for (int i = 0; i < diff; i++) {
                        extraEntries.add(key);
                    }
                }
            }

            System.out.println("A列比C列多出的数据(共 " + extraEntries.size() + " 条):");
            for (String val : extraEntries) {
                System.out.println("'" + val + "'");
            }

        } catch (IOException e) {
            System.err.println("读取Excel文件错误:" + e.getMessage());
            e.printStackTrace();
        }
    }


//    public static void main(String[] args) {
//        String filePath = "D:\\test.xlsx";
//
//        try (FileInputStream fis = new FileInputStream(filePath);
//             Workbook workbook = new XSSFWorkbook(fis)) {
//
//            Sheet sheet = workbook.getSheetAt(0); // 读取第一个sheet
//            if (sheet == null) {
//                System.out.println("Excel中没有Sheet");
//                return;
//            }
//
//            DataFormatter dataFormatter = new DataFormatter();
//
//            // 用于存放A列和C列的所有数据(去重)
//            Set<String> setA = new HashSet<>();
//            Set<String> setC = new HashSet<>();
//
//            // 读取所有行,跳过空行
//            for (Row row : sheet) {
//                if (row == null) continue;
//
//                // A列索引是0,C列索引是2
//                Cell cellA = row.getCell(0);
//                Cell cellC = row.getCell(2);
//
//                // 使用DataFormatter获取单元格字符串,避免数据格式问题
//                String valA = cellA != null ? dataFormatter.formatCellValue(cellA).trim() : null;
//                String valC = cellC != null ? dataFormatter.formatCellValue(cellC).trim() : null;
//
//                if (valA != null && !valA.isEmpty()) {
//                    setA.add(valA);
//                }
//                if (valC != null && !valC.isEmpty()) {
//                    setC.add(valC);
//                }
//            }
//
//            // 找出A列中但不在C列中的数据
//            Set<String> difference = new HashSet<>(setA);
//            difference.removeAll(setC);
//
//            System.out.println("A列比C列多出的数据如下:");
//            if (difference.isEmpty()) {
//                System.out.println("无多出数据");
//            } else {
//                difference.forEach(System.out::println);
//            }
//
//        } catch (IOException e) {
//            System.err.println("读取Excel文件时出错:" + e.getMessage());
//            e.printStackTrace();
//        }
//    }
}

控制台输出结果,不管有那些差异当前程序都能循环比对出来

相关推荐
angushine18 小时前
Python将Word转换为Excel
python·word·excel
封奚泽优1 天前
使用Python绘制金融数据可视化工具
python·信息可视化·excel·pandas·pyplot·qtwidgets·qtcore
木木子99992 天前
Excel——重复值处理
excel
UrbanJazzerati2 天前
Excel 函数 `SUBSTITUTE` 用法详解:替换文本中的字符
excel
何中应2 天前
EasyExcel使用(二:写出)
java·后端·maven·excel
m0_462185112 天前
VB解除excel保护工作表
excel
qq_463944862 天前
如何把Excel文件导入Navicat?
数据库·excel
不太厉害的程序员2 天前
Excel 将数据导入到SQLServer数据库
数据库·sqlserver·excel
开开心心_Every2 天前
多线程语音识别工具
javascript·人工智能·ocr·excel·语音识别·symfony
Goona_3 天前
拒绝SQL恐惧:用Python+pyqt打造任意Excel数据库查询系统
数据库·python·sql·excel·pyqt