LeetCode - #196 删除重复的电子邮件并保留最小 ID 的唯一电子邮件



网罗开发 (小红书、快手、视频号同名)

大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。

图书作者:《ESP32-C3 物联网工程开发实战》
图书作者:《SwiftUI 入门,进阶与实战》
超级个体:COC上海社区主理人
特约讲师:大学讲师,谷歌亚马逊分享嘉宾
科技博主:极星会首批签约作者

文章目录

摘要

在数据库操作中,去除重复数据是常见的任务之一。本篇文章将使用 Swift 语言模拟 SQL 操作,解决删除重复电子邮件并保留最小 id 的唯一电子邮件的问题。通过详细的代码分析和示例展示,帮助读者理解如何实现该功能。

描述

问题背景

给定一个 Person 表,表中包含 idemail 字段。每个电子邮件可以出现多次,任务是删除重复的电子邮件,仅保留 id 最小的那个。

输入: Person 表:

txt 复制代码
+----+------------------+
| id | email            |
+----+------------------+
| 1  | [email protected] |
| 2  | [email protected]  |
| 3  | [email protected] |
+----+------------------+

输出:

txt 复制代码
+----+------------------+
| id | email            |
+----+------------------+
| 1  | [email protected] |
| 2  | [email protected]  |
+----+------------------+

解释:

题解答案

要删除重复的电子邮件,并保留最小 id 的唯一电子邮件,首先可以利用字典或集合来查找重复的 email,然后基于 id 删除不必要的记录。

Swift 解法:

  1. 遍历表格数据 :通过遍历 Person 表的所有记录,检查是否有重复的 email
  2. 删除重复记录 :将重复的 email 对应记录的 id 大于最小值的项删除。

下面是基于 Swift 的实现:

题解代码

swift 复制代码
import Foundation

struct Person {
    var id: Int
    var email: String
}

func removeDuplicateEmails(persons: inout [Person]) {
    var seenEmails: [String: Int] = [:]  // 用来存储每个电子邮件的最小 id

    // 遍历列表,找到每个电子邮件的最小 id
    for person in persons {
        if let existingId = seenEmails[person.email] {
            // 如果该邮箱已存在且当前 id 较大,则删除
            if person.id < existingId {
                seenEmails[person.email] = person.id
            }
        } else {
            seenEmails[person.email] = person.id
        }
    }

    // 根据 seenEmails 过滤掉不需要的记录
    persons = persons.filter { seenEmails[$0.email] == $0.id }
}

// 示例数据
var persons = [
    Person(id: 1, email: "[email protected]"),
    Person(id: 2, email: "[email protected]"),
    Person(id: 3, email: "[email protected]")
]

// 执行删除重复邮件
removeDuplicateEmails(persons: &persons)

// 输出结果
for person in persons {
    print("\(person.id) \(person.email)")
}

题解代码分析

  1. 数据结构

    • 使用 seenEmails 字典存储每个 email 对应的最小 id
    • 如果遇到相同的 email,则比较 id,保留最小的 id
  2. 过滤重复记录

    • 遍历所有 Person 记录,通过 seenEmails 判断是否为该 email 的最小 id,过滤掉不符合条件的记录。
  3. 输出结果

    • 输出符合条件的记录,即保留最小 id 的唯一电子邮件。

示例测试及结果

输入数据:

swift 复制代码
var persons = [
    Person(id: 1, email: "[email protected]"),
    Person(id: 2, email: "[email protected]"),
    Person(id: 3, email: "[email protected]")
]

输出结果:

txt 复制代码
1 [email protected]
2 [email protected]

时间复杂度

  1. 遍历数据

    • 对于每个 Person,检查并更新 seenEmails 的操作是 O(1),因此遍历所有记录的时间复杂度是 O(n),其中 n 是记录数。
  2. 过滤记录

    • 使用 filter 操作过滤掉重复记录,时间复杂度是 O(n)
  3. 总时间复杂度

    • 总的时间复杂度是 O(n)

空间复杂度

  1. 存储数据

    • seenEmails 字典存储每个 email 的最小 id,因此空间复杂度为 O(m),其中 m 是不同的 email 数量。
  2. 输出数据

    • 存储符合条件的 Person 数组空间复杂度为 O(n)
  3. 总空间复杂度

    • 总的空间复杂度是 O(n + m)

总结

  1. Swift 的实现 :通过字典存储电子邮件的最小 id,高效去除重复邮件并保留最小 id 的记录。
  2. 适用场景:适用于需要去重并保留唯一记录的场景,例如用户数据库的去重操作。
  3. 时间与空间效率 :时间复杂度为 O(n),空间复杂度为 O(n + m),对于较大的数据集也能高效处理。

未来展望

  1. 可以扩展为支持更多字段的去重操作。
  2. 对于非常大的数据集,可以采用分布式存储和处理机制进行优化。
  3. 提供更多的过滤条件,例如按其他字段去重。

参考资料

相关推荐
PBitW几秒前
工作中突然发现零宽字符串的作用了!
前端·javascript·vue.js
工业互联网专业10 分钟前
基于springboot+vue的校园二手物品交易平台
java·vue.js·spring boot·毕业设计·源码·课程设计·校园二手物品交易平台
JPC客栈24 分钟前
LeetCode面试经典 150 题(Java题解)
java·leetcode·面试
冷冷清清中的风风火火26 分钟前
关于敏感文件或备份 安全配置错误 禁止通过 URL 访问 Vue 项目打包后的 .gz 压缩文件
前端·vue.js·安全
爱的叹息39 分钟前
关于 梯度下降算法、线性回归模型、梯度下降训练线性回归、线性回归的其他训练算法 以及 回归模型分类 的详细说明
人工智能·算法·回归·线性回归
城南已开9791 小时前
vue部署到nginx服务器 启用gzip
服务器·vue.js·nginx
冠位观测者1 小时前
【Leetcode 每日一题】781. 森林中的兔子
数据结构·算法·leetcode
RePeaT1 小时前
高亮自定义指令,表格前一列也高亮?
前端·vue.js·笔记
被AI抢饭碗的人1 小时前
算法题(130):激光炸弹
数据结构·算法
前端大卫1 小时前
Vue 3 调用深层组件方法,这 3 招够用了!
前端·vue.js