在C#中测试比较目录的不同方法以查看它们有哪些共同的文件

C# 中的示例"比较目录以查看它们有哪些共同的文件"使用Directory.GetFiles获取两个目录中的文件。它对文件进行排序,并比较两个排序后的列表以查看哪些文件位于第一个目录中、第二个目录中或两个目录中。有关其工作原理的详细信息,请参阅该示例。

Kuru 发表了一条评论,称 LINQ 更简单,可读性更强。此示例比较了原始代码和两种 LINQ 方法。

第一种 LINQ 方法使用 LINQ 从目录中选择文件并对其进行排序。然后像以前一样循环遍历排序后的列表,以查看哪些文件位于哪个目录中。以下代码显示了此方法如何使用 LINQ 选择文件。

cs 复制代码
// Use LINQ twice to compare the files in each directory.
private void Compare_LinqTwice(string dir1, string dir2)
{
    // Get sorted lists of files in the directories.
    DirectoryInfo dir1_info = new DirectoryInfo(dir1);
    var dir1_query =
        from FileInfo file_info in dir1_info.GetFiles()
        orderby file_info.Name
        select file_info.Name;
    string[] file_names1 = dir1_query.ToArray();

    DirectoryInfo dir2_info = new DirectoryInfo(dir2);
    var dir2_query =
        from FileInfo file_info in dir2_info.GetFiles()
        orderby file_info.Name
        select file_info.Name;
    string[] file_names2 = dir2_query.ToArray();

    // Compare.
    ...
}

此代码为第一个目录创建了一个DirectoryInfo对象。LINQ 查询使用该对象的GetFiles方法获取表示目录文件的FileInfo对象的可枚举列表。它按FileInfo对象的名称对结果进行排序,然后选择这些名称。然后,程序调用查询的ToArray方法将结果复制到字符串数组中。

代码重复这些步骤以获得包含第二个目录的文件名的排序数组。然后像上一个示例一样比较这两个数组。

以下代码展示了第三种方法。(Kuru 建议的方法。)

cs 复制代码
// Use LINQ joins to compare the files in each directory.
private void Compare_LinqJoins(string dir1, string dir2)
{
    // Get sorted lists of files in the directories.
    DirectoryInfo dir1_info = new DirectoryInfo(dir1);
    var dir1_query =
        from FileInfo file_info in dir1_info.GetFiles()
        //orderby file_info.Name
        select file_info.Name;
    string[] file_names1 = dir1_query.ToArray();

    DirectoryInfo dir2_info = new DirectoryInfo(dir2);
    var dir2_query =
        from FileInfo file_info in dir2_info.GetFiles()
        //orderby file_info.Name
        select file_info.Name;
    string[] file_names2 = dir2_query.ToArray();

    // Compare.
    var dir1_only_query =
        from string file_name in file_names1
        where (!file_names2.Contains(file_name))
        select file_name;
    List<string> dir1_only = dir1_only_query.ToList();

    var dir2_only_query =
        from string file_name in file_names2
        where (!file_names1.Contains(file_name))
        select file_name;
    List<string> dir2_only = dir2_only_query.ToList();

    var both_query =
        from string file_name in file_names1
        where (file_names2.Contains(file_name))
        select file_name;
    List<string> both = both_query.ToList();
}

此方法使用DirectoryInfo对象和 LINQ 来获取包含目录文件的数组(如前所述)。此程序不再循环遍历名称数组,而是使用三个 LINQ 查询来选择仅存在于第一个目录中、仅存在于第二个目录中或同时存在于两个目录中的文件。

所有三种方法都将结果存储在List中,而不是像原始示例那样将结果显示在DataGridView中。该程序对每种方法运行 10 次试验,以获得足够有意义的时间。

如果你仔细看文章顶部的图片,你会发现原始方法是最快的。第二种使用 LINQ 选择文件的方法花费的时间大约长 50%。

第三种方法使用 LINQ 来确定哪些文件位于哪些目录中,耗时几乎是第一种方法的 10 倍。它当然更简单,而且您可能会发现它比第一种方法更容易阅读,但它要慢得多。

(我也尝试使用第三种方法,但最后三个 LINQ 查询从前两个查询中选择数据,而不是从文件名数组中选择数据。这样速度要慢得多。几分钟后我就等得不耐烦了,于是就停止了程序。)

例如结果:

相关推荐
SaleCoder1 小时前
用Python构建机器学习模型预测股票趋势:从数据到部署的实战指南
开发语言·python·机器学习·python股票预测·lstm股票模型·机器学习股票趋势
玩代码6 小时前
备忘录设计模式
java·开发语言·设计模式·备忘录设计模式
技术猿188702783517 小时前
实现“micro 关键字搜索全覆盖商品”并通过 API 接口提供实时数据(一个方法)
开发语言·网络·python·深度学习·测试工具
放飞自我的Coder7 小时前
【colab 使用uv创建一个新的python版本运行】
开发语言·python·uv
艾莉丝努力练剑8 小时前
【数据结构与算法】数据结构初阶:详解顺序表和链表(四)——单链表(下)
c语言·开发语言·数据结构·学习·算法·链表
zyhomepage8 小时前
科技的成就(六十九)
开发语言·网络·人工智能·科技·内容运营
珊瑚里的鱼8 小时前
第十三讲 | map和set的使用
开发语言·c++·笔记·visualstudio·visual studio
逑之8 小时前
C++笔记1:命名空间,缺省参数,引用等
开发语言·c++·笔记
songroom8 小时前
【转】Rust: PhantomData,#may_dangle和Drop Check 真真假假
开发语言·后端·rust
RealmElysia8 小时前
java反射
java·开发语言