Microsoft VBA Excel 去重小工具

问题简述

在本工作表中,A1:B3单元格样式如下,通过名称管理器B列的单元格被命名为"LinkFile"、"SheetName"、"InputArea",请实现以下功能:读取Excel文件中的数据,去除重复的数据,并记录每个数据项最后一次出现的位置,最后将结果输出到当前工作表中。

A B
1 Link File:
2 Sheet Name:
3 Input Area:

代码描述

第一步:

读取:输入一个xls表格文件的地址到"LinkFile"、该文件内工作表名称到"SheetName"和需要读取数据的范围(例如A2:A102)到"InputArea",根据指定范围在该文件内指定工作表中读取所有数据;
第二步:

去重和获得索引:上一步获取的数据中存在重复,因此只需要保留唯一值,根据唯一值获得该值最后一次出现在读取数据范围的行列位置信息;
第三步:

输出:在本工作表中,在"InputArea"单元格下两行开始输出从上一步得到的单元格数据和对应的行列信息,也就是从A5开始输入单元格数据,B5开始输入对应的行列信息。

vba 复制代码
Sub ProcessData()
    Dim srcWb As Workbook
    Dim ws As Worksheet, srcWs As Worksheet
    Dim linkFile As String, sheetName As String, inputArea As String
    Dim rng As Range, cell As Range
    Dim dict As Object
    Dim outputRow As Long
    
    ' 创建字典来存储唯一值和对应的最后位置
    Set dict = CreateObject("Scripting.Dictionary")
    
    ' 获取当前活动的工作表
    Set ws = ThisWorkbook.ActiveSheet
    
    ' 读取工作表中的相关数据
    linkFile = ws.Range("LinkFile").Value
    sheetName = ws.Range("SheetName").Value
    inputArea = ws.Range("InputArea").Value
    
    ' 打开源数据文件
    Set srcWb = Workbooks.Open(linkFile)
    Set srcWs = srcWb.Sheets(sheetName)
    
    ' 获取指定范围
    Set rng = srcWs.Range(inputArea)
    
    ' 遍历范围,收集数据
    For Each cell In rng
        If Not dict.Exists(cell.Value) Then
            dict.Add cell.Value, cell.Address(False, False)
        Else
            dict(cell.Value) = cell.Address(False, False)  ' 更新为最后出现的位置
        End If
    Next cell
    
    ' 关闭源数据文件
    srcWb.Close False
    
    ' 输出结果
    outputRow = ws.Range("InputArea").Row + 2
    For Each key In dict.Keys
        ws.Cells(outputRow, 1).Value = key
        ws.Cells(outputRow, 2).Value = dict(key)
        outputRow = outputRow + 1
    Next
    
    MsgBox "数据处理完毕!"
End Sub

English:

vba 复制代码
Sub ProcessData()
    Dim srcWb As Workbook
    Dim ws As Worksheet, srcWs As Worksheet
    Dim linkFile As String, sheetName As String, inputArea As String
    Dim rng As Range, cell As Range
    Dim dict As Object
    Dim outputRow As Long
    
    ' Create a dictionary to store unique values and corresponding last positions
    Set dict = CreateObject("Scripting.Dictionary")
    
    ' Get the currently active worksheet
    Set ws = ThisWorkbook.ActiveSheet
    
    ' Read relevant data from the worksheet
    linkFile = ws.Range("LinkFile").Value
    sheetName = ws.Range("SheetName").Value
    inputArea = ws.Range("InputArea").Value
    
    ' Open the source data file
    Set srcWb = Workbooks.Open(linkFile)
    Set srcWs = srcWb.Sheets(sheetName)
    
    ' Get the specified range
    Set rng = srcWs.Range(inputArea)
    
    ' Iterate over the range, collecting data
    For Each cell In rng
        If Not dict.Exists(cell.Value) Then
            dict.Add cell.Value, cell.Address(False, False)
        Else
            dict(cell.Value) = cell.Address(False, False)  ' Update to the last position of occurrence
        End If
    Next cell
    
    ' Close the source data file
    srcWb.Close False
    
    ' Output the results
    outputRow = ws.Range("InputArea").Row + 2
    For Each key In dict.Keys
        ws.Cells(outputRow, 1).Value = key
        ws.Cells(outputRow, 2).Value = dict(key)
        outputRow = outputRow + 1
    Next
    
    MsgBox "Data processed successfully!"
End Sub

总结

相关推荐
写了20年代码的老程序员13 小时前
Excel 导入导出为什么总是把后端逼成字段搬运工
java·excel
Cloud_Shy61813 小时前
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十一章 Python 包跟踪器 中篇)
数据库·python·sql·数据分析·excel·web
Metaphor69215 小时前
使用 Python 将 Excel 转换为 PDF
python·pdf·excel
步步为营DotNet15 小时前
洞悉.NET 11:Blazor 与 Microsoft.Extensions.AI 的融合创新实践
人工智能·microsoft·.net
星越华夏17 小时前
Pandas获取excel表sheet名称
excel·pandas
GEO从入门到精通18 小时前
GEO学习与传统SEO学习有什么区别?
人工智能·学习·microsoft
俊哥工具18 小时前
不用安装不收费!多功能U盘修复工具,解决大部分U盘故障
学习·pdf·word·excel·音视频
_oP_i19 小时前
Excel 工作簿取消保护
excel
雪度娃娃19 小时前
行为型设计模式——中介者模式
microsoft·设计模式·中介者模式
程序员杰哥20 小时前
Python+requests+excel 接口自动化测试框架
自动化测试·软件测试·python·测试工具·测试用例·excel·接口测试