python 实现两个文本文件内容去重

嗨喽,大家好呀~这里是爱看美女的茜茜呐

👇 👇 👇 更多精彩机密、教程,尽在下方,赶紧点击了解吧~

python源码、视频教程、插件安装教程、资料我都准备好了,直接在文末名片自取就可


实现两个文本内容去重,输出两个文本不重复的结果

两个测试文本内容如下

cpp 复制代码
1.txt中内容为 1 2 3 4 5 6 7 8
2.txt中内容为 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 

分别读取两个文本的内容

读取1.txt的内容,具体实现如下:

cpp 复制代码
str1 = []
file_1 = open("1.txt","r",encoding="utf-8")
for line in file_1.readlines():
    str1.append(line.replace("\n",""))

读取2.txt的内容,具体实现如下:

cpp 复制代码
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:261823976
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
str2 = []
file_2 = open("2.txt", "r", encoding="utf-8")
for line in file_2.readlines():
    str2.append(line.replace("\n", ""))   

取出重复的内容

创建一个空列表,将两个文件中重复的内容取出来,具体实现如下:

cpp 复制代码
str_dump = []
for line in str1:
    if line in str2:
        str_dump.append(line)    #将两个文件重复的内容取出来

去掉重复内容

将两个文本的内容合并,去除重复的内容

cpp 复制代码
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:261823976
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
str_all = set(str1 + str2)      #将两个文件放到集合里,过滤掉重复内容
for i in str_dump:              
    if i in str_all:
        str_all.remove(i)       #去掉重复的文件

完整代码如下

cpp 复制代码
def file_qc():
    str1 = []
    file_1 = open("1.txt","r",encoding="utf-8")
    for line in file_1.readlines():
        str1.append(line.replace("\n",""))

    str2 = []
    file_2 = open("2.txt", "r", encoding="utf-8")
    for line in file_2.readlines():
        str2.append(line.replace("\n", ""))

    str_dump = []
    for line in str1:
        if line in str2:
            str_dump.append(line)    #将两个文件重复的内容取出来

    str_all = set(str1 + str2)      #将两个文件放到集合里,过滤掉重复内容

    for i in str_dump:              
        if i in str_all:
            str_all.remove(i)		#去掉重复的文件

    for str in str_all:             #去重后的结果写入文件
        print(str)
        with open("qc_V.txt","a+",encoding="utf-8") as f:
            f.write(str + "\n")

if __name__=="__main__":
    file_qc()

输出结果为

尾语

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇

相关推荐
小龙报8 小时前
算法通关指南:数据结构和算法篇 --- 队列相关算法题》--- 1. 【模板】队列,2. 机器翻译
c语言·开发语言·数据结构·c++·算法·学习方法·visual studio
晚秋大魔王8 小时前
基于python的jlink单片机自动化批量烧录工具
前端·python·单片机
胖哥真不错8 小时前
Python基于PyTorch实现多输入多输出进行CNN卷积神经网络回归预测项目实战
pytorch·python·毕业设计·课程设计·毕设·多输入多输出·cnn卷积神经网络回归预测
木木em哈哈8 小时前
有关于cnb自动化的脚本补全
服务器·开发语言·pygame
星释8 小时前
Rust 练习册 :Poker与扑克牌游戏
开发语言·游戏·rust
程序员-小李8 小时前
基于PyTorch的动物识别模型训练与应用实战
人工智能·pytorch·python
喜欢吃燃面8 小时前
Linux:make自动化和实战演练
linux·学习
Mr_Xuhhh8 小时前
GUI自动化测试--自动化简单示例
运维·服务器·自动化
晨非辰9 小时前
【数据结构初阶】--从排序算法原理分析到代码实现操作,参透插入排序的奥秘!
c语言·开发语言·数据结构·c++·算法·面试·排序算法
羑悻的小杀马特9 小时前
零成本自建私人知识库教学,Leanote+Cpolar 内网穿透,手机电脑随时同步,无需云服务器,效率翻倍!
运维·服务器·coplar·leanote