LeetCode - #196 删除重复的电子邮件并保留最小 ID 的唯一电子邮件



网罗开发 (小红书、快手、视频号同名)

大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。

图书作者:《ESP32-C3 物联网工程开发实战》
图书作者:《SwiftUI 入门,进阶与实战》
超级个体:COC上海社区主理人
特约讲师:大学讲师,谷歌亚马逊分享嘉宾
科技博主:极星会首批签约作者

文章目录

摘要

在数据库操作中,去除重复数据是常见的任务之一。本篇文章将使用 Swift 语言模拟 SQL 操作,解决删除重复电子邮件并保留最小 id 的唯一电子邮件的问题。通过详细的代码分析和示例展示,帮助读者理解如何实现该功能。

描述

问题背景

给定一个 Person 表,表中包含 idemail 字段。每个电子邮件可以出现多次,任务是删除重复的电子邮件,仅保留 id 最小的那个。

输入: Person 表:

txt 复制代码
+----+------------------+
| id | email            |
+----+------------------+
| 1  | john@example.com |
| 2  | bob@example.com  |
| 3  | john@example.com |
+----+------------------+

输出:

txt 复制代码
+----+------------------+
| id | email            |
+----+------------------+
| 1  | john@example.com |
| 2  | bob@example.com  |
+----+------------------+

解释:

  • john@example.com 重复出现了两次,保留最小 id 的一条记录。

题解答案

要删除重复的电子邮件,并保留最小 id 的唯一电子邮件,首先可以利用字典或集合来查找重复的 email,然后基于 id 删除不必要的记录。

Swift 解法:

  1. 遍历表格数据 :通过遍历 Person 表的所有记录,检查是否有重复的 email
  2. 删除重复记录 :将重复的 email 对应记录的 id 大于最小值的项删除。

下面是基于 Swift 的实现:

题解代码

swift 复制代码
import Foundation

struct Person {
    var id: Int
    var email: String
}

func removeDuplicateEmails(persons: inout [Person]) {
    var seenEmails: [String: Int] = [:]  // 用来存储每个电子邮件的最小 id

    // 遍历列表,找到每个电子邮件的最小 id
    for person in persons {
        if let existingId = seenEmails[person.email] {
            // 如果该邮箱已存在且当前 id 较大,则删除
            if person.id < existingId {
                seenEmails[person.email] = person.id
            }
        } else {
            seenEmails[person.email] = person.id
        }
    }

    // 根据 seenEmails 过滤掉不需要的记录
    persons = persons.filter { seenEmails[$0.email] == $0.id }
}

// 示例数据
var persons = [
    Person(id: 1, email: "john@example.com"),
    Person(id: 2, email: "bob@example.com"),
    Person(id: 3, email: "john@example.com")
]

// 执行删除重复邮件
removeDuplicateEmails(persons: &persons)

// 输出结果
for person in persons {
    print("\(person.id) \(person.email)")
}

题解代码分析

  1. 数据结构

    • 使用 seenEmails 字典存储每个 email 对应的最小 id
    • 如果遇到相同的 email,则比较 id,保留最小的 id
  2. 过滤重复记录

    • 遍历所有 Person 记录,通过 seenEmails 判断是否为该 email 的最小 id,过滤掉不符合条件的记录。
  3. 输出结果

    • 输出符合条件的记录,即保留最小 id 的唯一电子邮件。

示例测试及结果

输入数据:

swift 复制代码
var persons = [
    Person(id: 1, email: "john@example.com"),
    Person(id: 2, email: "bob@example.com"),
    Person(id: 3, email: "john@example.com")
]

输出结果:

txt 复制代码
1 john@example.com
2 bob@example.com

时间复杂度

  1. 遍历数据

    • 对于每个 Person,检查并更新 seenEmails 的操作是 O(1),因此遍历所有记录的时间复杂度是 O(n),其中 n 是记录数。
  2. 过滤记录

    • 使用 filter 操作过滤掉重复记录,时间复杂度是 O(n)
  3. 总时间复杂度

    • 总的时间复杂度是 O(n)

空间复杂度

  1. 存储数据

    • seenEmails 字典存储每个 email 的最小 id,因此空间复杂度为 O(m),其中 m 是不同的 email 数量。
  2. 输出数据

    • 存储符合条件的 Person 数组空间复杂度为 O(n)
  3. 总空间复杂度

    • 总的空间复杂度是 O(n + m)

总结

  1. Swift 的实现 :通过字典存储电子邮件的最小 id,高效去除重复邮件并保留最小 id 的记录。
  2. 适用场景:适用于需要去重并保留唯一记录的场景,例如用户数据库的去重操作。
  3. 时间与空间效率 :时间复杂度为 O(n),空间复杂度为 O(n + m),对于较大的数据集也能高效处理。

未来展望

  1. 可以扩展为支持更多字段的去重操作。
  2. 对于非常大的数据集,可以采用分布式存储和处理机制进行优化。
  3. 提供更多的过滤条件,例如按其他字段去重。

参考资料

相关推荐
wyiyiyi10 分钟前
【笔记分享】集合的基数、群、环、域
人工智能·笔记·算法·数学建模·学习方法·抽象代数
萌新小码农‍20 分钟前
Vue集成MarkDown
前端·javascript·vue.js
秋说36 分钟前
【PTA数据结构 | C语言版】后缀表达式求值
c语言·数据结构·算法
Eloudy40 分钟前
cuDNN 的 IMPLICIT_GEMM 算法
算法·gpu·gemm
盛寒1 小时前
等价矩阵和等价向量组
线性代数·算法·矩阵
mit6.8241 小时前
youtube图论
c++·算法
DoraBigHead1 小时前
🧠 小哆啦解题记 —— 谁偷走了我的快乐?
算法
想躺平的咸鱼干2 小时前
JVM的垃圾回收算法和多种GC算法
java·jvm·算法·垃圾回收算法·jvm体系结构
满分观察网友z2 小时前
从 Null 到 Next:我如何用 O(1) 空间“点亮”了 UI 树的导航路径(117. 填充每个节点的下一个右侧节点指针 II)
后端·算法