在C#中测试比较目录的不同方法以查看它们有哪些共同的文件

C# 中的示例"比较目录以查看它们有哪些共同的文件"使用Directory.GetFiles获取两个目录中的文件。它对文件进行排序,并比较两个排序后的列表以查看哪些文件位于第一个目录中、第二个目录中或两个目录中。有关其工作原理的详细信息,请参阅该示例。

Kuru 发表了一条评论,称 LINQ 更简单,可读性更强。此示例比较了原始代码和两种 LINQ 方法。

第一种 LINQ 方法使用 LINQ 从目录中选择文件并对其进行排序。然后像以前一样循环遍历排序后的列表,以查看哪些文件位于哪个目录中。以下代码显示了此方法如何使用 LINQ 选择文件。

cs 复制代码
// Use LINQ twice to compare the files in each directory.
private void Compare_LinqTwice(string dir1, string dir2)
{
    // Get sorted lists of files in the directories.
    DirectoryInfo dir1_info = new DirectoryInfo(dir1);
    var dir1_query =
        from FileInfo file_info in dir1_info.GetFiles()
        orderby file_info.Name
        select file_info.Name;
    string[] file_names1 = dir1_query.ToArray();

    DirectoryInfo dir2_info = new DirectoryInfo(dir2);
    var dir2_query =
        from FileInfo file_info in dir2_info.GetFiles()
        orderby file_info.Name
        select file_info.Name;
    string[] file_names2 = dir2_query.ToArray();

    // Compare.
    ...
}

此代码为第一个目录创建了一个DirectoryInfo对象。LINQ 查询使用该对象的GetFiles方法获取表示目录文件的FileInfo对象的可枚举列表。它按FileInfo对象的名称对结果进行排序,然后选择这些名称。然后,程序调用查询的ToArray方法将结果复制到字符串数组中。

代码重复这些步骤以获得包含第二个目录的文件名的排序数组。然后像上一个示例一样比较这两个数组。

以下代码展示了第三种方法。(Kuru 建议的方法。)

cs 复制代码
// Use LINQ joins to compare the files in each directory.
private void Compare_LinqJoins(string dir1, string dir2)
{
    // Get sorted lists of files in the directories.
    DirectoryInfo dir1_info = new DirectoryInfo(dir1);
    var dir1_query =
        from FileInfo file_info in dir1_info.GetFiles()
        //orderby file_info.Name
        select file_info.Name;
    string[] file_names1 = dir1_query.ToArray();

    DirectoryInfo dir2_info = new DirectoryInfo(dir2);
    var dir2_query =
        from FileInfo file_info in dir2_info.GetFiles()
        //orderby file_info.Name
        select file_info.Name;
    string[] file_names2 = dir2_query.ToArray();

    // Compare.
    var dir1_only_query =
        from string file_name in file_names1
        where (!file_names2.Contains(file_name))
        select file_name;
    List<string> dir1_only = dir1_only_query.ToList();

    var dir2_only_query =
        from string file_name in file_names2
        where (!file_names1.Contains(file_name))
        select file_name;
    List<string> dir2_only = dir2_only_query.ToList();

    var both_query =
        from string file_name in file_names1
        where (file_names2.Contains(file_name))
        select file_name;
    List<string> both = both_query.ToList();
}

此方法使用DirectoryInfo对象和 LINQ 来获取包含目录文件的数组(如前所述)。此程序不再循环遍历名称数组,而是使用三个 LINQ 查询来选择仅存在于第一个目录中、仅存在于第二个目录中或同时存在于两个目录中的文件。

所有三种方法都将结果存储在List中,而不是像原始示例那样将结果显示在DataGridView中。该程序对每种方法运行 10 次试验,以获得足够有意义的时间。

如果你仔细看文章顶部的图片,你会发现原始方法是最快的。第二种使用 LINQ 选择文件的方法花费的时间大约长 50%。

第三种方法使用 LINQ 来确定哪些文件位于哪些目录中,耗时几乎是第一种方法的 10 倍。它当然更简单,而且您可能会发现它比第一种方法更容易阅读,但它要慢得多。

(我也尝试使用第三种方法,但最后三个 LINQ 查询从前两个查询中选择数据,而不是从文件名数组中选择数据。这样速度要慢得多。几分钟后我就等得不耐烦了,于是就停止了程序。)

例如结果:

相关推荐
19H1 小时前
Flink-Source算子状态恢复分析
c#·linq
weixin_472339462 小时前
高效处理大体积Excel文件的Java技术方案解析
java·开发语言·excel
枯萎穿心攻击3 小时前
响应式编程入门教程第二节:构建 ObservableProperty<T> — 封装 ReactiveProperty 的高级用法
开发语言·unity·c#·游戏引擎
Eiceblue4 小时前
【免费.NET方案】CSV到PDF与DataTable的快速转换
开发语言·pdf·c#·.net
m0_555762905 小时前
Matlab 频谱分析 (Spectral Analysis)
开发语言·matlab
浪裡遊6 小时前
React Hooks全面解析:从基础到高级的实用指南
开发语言·前端·javascript·react.js·node.js·ecmascript·php
lzb_kkk7 小时前
【C++】C++四种类型转换操作符详解
开发语言·c++·windows·1024程序员节
好开心啊没烦恼7 小时前
Python 数据分析:numpy,说人话,说说数组维度。听故事学知识点怎么这么容易?
开发语言·人工智能·python·数据挖掘·数据分析·numpy
简佐义的博客7 小时前
破解非模式物种GO/KEGG注释难题
开发语言·数据库·后端·oracle·golang