LeetCode - #196 删除重复的电子邮件并保留最小 ID 的唯一电子邮件



网罗开发 (小红书、快手、视频号同名)

大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。

图书作者:《ESP32-C3 物联网工程开发实战》
图书作者:《SwiftUI 入门,进阶与实战》
超级个体:COC上海社区主理人
特约讲师:大学讲师,谷歌亚马逊分享嘉宾
科技博主:极星会首批签约作者

文章目录

摘要

在数据库操作中,去除重复数据是常见的任务之一。本篇文章将使用 Swift 语言模拟 SQL 操作,解决删除重复电子邮件并保留最小 id 的唯一电子邮件的问题。通过详细的代码分析和示例展示,帮助读者理解如何实现该功能。

描述

问题背景

给定一个 Person 表,表中包含 idemail 字段。每个电子邮件可以出现多次,任务是删除重复的电子邮件,仅保留 id 最小的那个。

输入: Person 表:

txt 复制代码
+----+------------------+
| id | email            |
+----+------------------+
| 1  | john@example.com |
| 2  | bob@example.com  |
| 3  | john@example.com |
+----+------------------+

输出:

txt 复制代码
+----+------------------+
| id | email            |
+----+------------------+
| 1  | john@example.com |
| 2  | bob@example.com  |
+----+------------------+

解释:

  • john@example.com 重复出现了两次,保留最小 id 的一条记录。

题解答案

要删除重复的电子邮件,并保留最小 id 的唯一电子邮件,首先可以利用字典或集合来查找重复的 email,然后基于 id 删除不必要的记录。

Swift 解法:

  1. 遍历表格数据 :通过遍历 Person 表的所有记录,检查是否有重复的 email
  2. 删除重复记录 :将重复的 email 对应记录的 id 大于最小值的项删除。

下面是基于 Swift 的实现:

题解代码

swift 复制代码
import Foundation

struct Person {
    var id: Int
    var email: String
}

func removeDuplicateEmails(persons: inout [Person]) {
    var seenEmails: [String: Int] = [:]  // 用来存储每个电子邮件的最小 id

    // 遍历列表,找到每个电子邮件的最小 id
    for person in persons {
        if let existingId = seenEmails[person.email] {
            // 如果该邮箱已存在且当前 id 较大,则删除
            if person.id < existingId {
                seenEmails[person.email] = person.id
            }
        } else {
            seenEmails[person.email] = person.id
        }
    }

    // 根据 seenEmails 过滤掉不需要的记录
    persons = persons.filter { seenEmails[$0.email] == $0.id }
}

// 示例数据
var persons = [
    Person(id: 1, email: "john@example.com"),
    Person(id: 2, email: "bob@example.com"),
    Person(id: 3, email: "john@example.com")
]

// 执行删除重复邮件
removeDuplicateEmails(persons: &persons)

// 输出结果
for person in persons {
    print("\(person.id) \(person.email)")
}

题解代码分析

  1. 数据结构

    • 使用 seenEmails 字典存储每个 email 对应的最小 id
    • 如果遇到相同的 email,则比较 id,保留最小的 id
  2. 过滤重复记录

    • 遍历所有 Person 记录,通过 seenEmails 判断是否为该 email 的最小 id,过滤掉不符合条件的记录。
  3. 输出结果

    • 输出符合条件的记录,即保留最小 id 的唯一电子邮件。

示例测试及结果

输入数据:

swift 复制代码
var persons = [
    Person(id: 1, email: "john@example.com"),
    Person(id: 2, email: "bob@example.com"),
    Person(id: 3, email: "john@example.com")
]

输出结果:

txt 复制代码
1 john@example.com
2 bob@example.com

时间复杂度

  1. 遍历数据

    • 对于每个 Person,检查并更新 seenEmails 的操作是 O(1),因此遍历所有记录的时间复杂度是 O(n),其中 n 是记录数。
  2. 过滤记录

    • 使用 filter 操作过滤掉重复记录,时间复杂度是 O(n)
  3. 总时间复杂度

    • 总的时间复杂度是 O(n)

空间复杂度

  1. 存储数据

    • seenEmails 字典存储每个 email 的最小 id,因此空间复杂度为 O(m),其中 m 是不同的 email 数量。
  2. 输出数据

    • 存储符合条件的 Person 数组空间复杂度为 O(n)
  3. 总空间复杂度

    • 总的空间复杂度是 O(n + m)

总结

  1. Swift 的实现 :通过字典存储电子邮件的最小 id,高效去除重复邮件并保留最小 id 的记录。
  2. 适用场景:适用于需要去重并保留唯一记录的场景,例如用户数据库的去重操作。
  3. 时间与空间效率 :时间复杂度为 O(n),空间复杂度为 O(n + m),对于较大的数据集也能高效处理。

未来展望

  1. 可以扩展为支持更多字段的去重操作。
  2. 对于非常大的数据集,可以采用分布式存储和处理机制进行优化。
  3. 提供更多的过滤条件,例如按其他字段去重。

参考资料

相关推荐
W23035765733 小时前
经典算法:最长上升子序列(LIS)深度解析 C++ 实现
开发语言·c++·算法
minji...3 小时前
Linux 线程同步与互斥(三) 生产者消费者模型,基于阻塞队列的生产者消费者模型的代码实现
linux·运维·服务器·开发语言·网络·c++·算法
语戚4 小时前
力扣 968. 监控二叉树 —— 贪心 & 树形 DP 双解法递归 + 非递归全解(Java 实现)
java·算法·leetcode·贪心算法·动态规划·力扣·
skywalker_114 小时前
力扣hot100-7(接雨水),8(无重复字符的最长子串)
算法·leetcode·职场和发展
布局呆星5 小时前
Vue3 | 组件通信学习小结
前端·vue.js
bIo7lyA8v6 小时前
算法稳定性分析中的输入扰动建模的技术9
算法
CoderCodingNo6 小时前
【GESP】C++三级真题 luogu-B4499, [GESP202603 三级] 二进制回文串
数据结构·c++·算法
sinat_286945196 小时前
AI Coding 时代的 TDD:从理念到工程落地
人工智能·深度学习·算法·tdd
炽烈小老头6 小时前
【 每天学习一点算法 2026/04/12】x 的平方根
学习·算法