题目:
表:
Person
+-------------+---------+ | Column Name | Type | +-------------+---------+ | id | int | | email | varchar | +-------------+---------+ id 是该表的主键列(具有唯一值的列)。 该表的每一行包含一封电子邮件。电子邮件将不包含大写字母。编写解决方案删除 所有重复的电子邮件,只保留一个具有最小
id的唯一电子邮件。(对于 SQL 用户,请注意你应该编写一个
DELETE语句而不是SELECT语句。)(对于 Pandas 用户,请注意你应该直接修改
Person表。)运行脚本后,显示的答案是
Person表。驱动程序将首先编译并运行您的代码片段,然后再显示Person表。Person表的最终顺序 无关紧要 。返回结果格式如下示例所示。
来源:力扣(LeetCode)
链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台
示例:
示例 1:
输入:
Person 表: +----+------------------+ | id | email | +----+------------------+ | 1 | john@example.com | | 2 | bob@example.com | | 3 | john@example.com | +----+------------------+输出:
+----+------------------+ | id | email | +----+------------------+ | 1 | john@example.com | | 2 | bob@example.com | +----+------------------+解释:john@example.com重复两次。我们保留最小的Id = 1。
解法:
先根据id列排序,然后使用drop_duplicates函数。
代码:
pythonimport pandas as pd def delete_duplicate_emails(person: pd.DataFrame) -> None: person.sort_values('id', inplace=True) person.drop_duplicates(subset='email', inplace=True)
力扣:196. 删除重复的电子邮箱(Python3)
恽劼恒2023-12-06 16:44
相关推荐
吃好睡好便好4 小时前
提取矩阵某一行或某一列元素小江的记录本7 小时前
【JVM虚拟机】垃圾回收GC:四种引用类型:强引用、软引用、弱引用、虚引用(附《思维导图》+《面试高频考点清单》)圣保罗的大教堂7 小时前
leetcode 2540. 最小公共值 简单APIshop7 小时前
Python 获取 1688 商品采集 API 接口 | 工厂货源自动化对接商品信息 | 无需选品deepin_sir7 小时前
10 - 函数云泽8088 小时前
笔试算法 -位运算篇(二):从唯一字符到消失数字charlee448 小时前
《GIS基础原理与技术实践》配套案例(Python版)枫叶林FYL8 小时前
项目十:事件溯源仓储管理系统(WMS)仿真实现ʚ希希ɞ ྀ8 小时前
不同路径|| -- dpIT 行者9 小时前
SimHash 与 MinHash:相似性计算的双子星算法