使用NPOI处理EXCEL文件:例1-关于优化的一些问题

记得有一次处理Excel文件对比,自己前后使用VBA和NPOI对比了下效率。由于涉及到页面的渲染和刷新,二者的处理速度差了个数量级(10多秒和几十分钟的差别)。当然使用NPOI操作时也做了一定优化。印象这么深刻这次一有需求就想到了NPOI。

需求:财务数据,只挑出最新月份(整数类型,yyyyMM)的数据。然后将数据增加一部分固定列内容按格式写入到另外一张表中。

由于宋丹丹老师把一切复杂的问题都总结为三步:打开冰箱门,把大象塞进去,关上冰箱门。那么我也把这个问题拆分出以下几个三步走

1、打开数据源:

使用NPOI可以打开xls和xlsx类型的,这个没有一点问题

由于使用了wpf,下面也又分为(以下没有什么好说的都是正常代码)

1.1 设置一个按钮

1.2 点击时弹出"打开文件"框

1.3如果选择了文件就获取文件路径。

2、读取数据:

上面获取了文件路径,我们就可以正常打开了。

对于如何读取到合适的数据,我在这里有个优化

先只读取日期列,找出最大日期的那些行。这里我用了一个Dictionary<DateTime, List<int>> 来保存行号。同时记录了一个最大的日期值。通过这点只读取了日期最大的行,会减少读取操作。我觉得这一点

cs 复制代码
 ISheet sheet = workbook.GetSheetAt(0);

 int cellcount = head.LastCellNum;//一行最多有多少个列
 long maxRow = sheet.LastRowNum;//页面有多少行
 Dictionary<DateTime, List<int>> dateRows = new Dictionary<DateTime, List<int>>();
 var rows = new List<IRow>();
 for (int i = 1; i < maxRow; i++)//第一行是标题行,忽略
 {
     var row = sheet.GetRow(i);
     var cell = row.GetCell(0);//日期行,数据形式yyyyMM
     if (cell != null)
     {
         var num=(int) cell.NumericCellValue;
         var year = num / 100;
         var mon = num% 100;
         var day = 1;
         var date = new DateTime(year, mon, day);
         if (dateRows.Keys.Contains(date))
         {
             dateRows[date].Add(i);
         }
         else
         {
             dateRows.Add(date, new List<int> { i });
         }
     }
 }

3、写入并保存文件:

由于单元格有一定格式,我想了一个取巧的办法-使用一个文件模板,保存的时候另存文件。

在数据写入的时候又发现了一个优化点。有20多行他们之前是可以采用循环来赋值的。

cs 复制代码
 

  //表1的第10行到34,对应表2的第18到42行,数据格式也一致,完美。
  for (int j = 9, k = 17; j < 34; j++, k++)
  {
      if (srcRow.Cells[j].CellType == CellType.Numeric)
      {

          row.CreateCell(k).SetCellValue(srcRow.Cells[j].NumericCellValue);
      }
  }

自我总结:一个简单的程序,自顶向下的思路,逐步解决问题。优化要多码,多总结。

相关推荐
Access开发易登软件1 小时前
Access开发导出PDF的N种姿势,你get了吗?
后端·低代码·pdf·excel·vba·access·access开发
課代表2 小时前
VBA 中的 Excel 工作表函数
excel·vba·函数·对象·属性·range·静态变量
UrbanJazzerati7 小时前
掌握 xlwings 的 used_range:高效处理 Excel 数据区域
python·面试·excel
m0_5557629010 小时前
Excel ——INDEX + MATCH 组合
excel
焚 城10 小时前
Excel数据导出小记二: [大数据示例]
大数据·excel
偷心伊普西隆11 小时前
Python EXCEL 小技巧:最快重新排列dataframe函数
python·excel
Leslie_Lei11 小时前
【EasyExcel】Excel工具类2.0
excel
HappyAcmen13 小时前
【自动化实战】Python操作Excel/WORD/PDF:openpyxl与docx库详解
python·自动化·excel
CHEN5_021 天前
【CouponHub项目开发】EasyExcel解析Excel并使用线程池异步执行和延时队列兜底
java·数据库·excel
我想起个名字1 天前
sqlserver2008导入excel表数据遇到的问题
sqlserver·excel