题目:
表:
Person
+-------------+---------+ | Column Name | Type | +-------------+---------+ | id | int | | email | varchar | +-------------+---------+ id 是该表的主键列(具有唯一值的列)。 该表的每一行包含一封电子邮件。电子邮件将不包含大写字母。编写解决方案删除 所有重复的电子邮件,只保留一个具有最小
id的唯一电子邮件。(对于 SQL 用户,请注意你应该编写一个
DELETE语句而不是SELECT语句。)(对于 Pandas 用户,请注意你应该直接修改
Person表。)运行脚本后,显示的答案是
Person表。驱动程序将首先编译并运行您的代码片段,然后再显示Person表。Person表的最终顺序 无关紧要 。返回结果格式如下示例所示。
来源:力扣(LeetCode)
链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台
示例:
示例 1:
输入:
Person 表: +----+------------------+ | id | email | +----+------------------+ | 1 | john@example.com | | 2 | bob@example.com | | 3 | john@example.com | +----+------------------+输出:
+----+------------------+ | id | email | +----+------------------+ | 1 | john@example.com | | 2 | bob@example.com | +----+------------------+解释:john@example.com重复两次。我们保留最小的Id = 1。
解法:
先根据id列排序,然后使用drop_duplicates函数。
代码:
pythonimport pandas as pd def delete_duplicate_emails(person: pd.DataFrame) -> None: person.sort_values('id', inplace=True) person.drop_duplicates(subset='email', inplace=True)
力扣:196. 删除重复的电子邮箱(Python3)
恽劼恒2023-12-06 16:44
相关推荐
一个行走的民5 分钟前
深度剖析 Ceph PG 分裂机制:原理、底层、实操、影响、线上避坑(最全完整版)WolfGang0073219 分钟前
代码随想录算法训练营 Day46 | 图论 part04zhangchaoxies14 分钟前
c++怎么在Linux下获取文件被最后一次访问的精确纳秒时间【进阶】拾-光15 分钟前
LTX-Video 2.3 实战:用图片生成视频,消费级显卡也能跑的开源 I2V 模型(GPT Image 2)m0_7478545216 分钟前
c++怎么在Linux下获取文件被最后一次访问的精确纳秒时间【进阶】AVA洋16 分钟前
初识Coze(扣子)工作流,ai视频自动化制作2301_8166602117 分钟前
如何用HTML函数工具检测当前设备性能_内置诊断操作【操作】小O的算法实验室19 分钟前
2026年ESWA,考虑曲率约束路径优化的 Dubins-RRT* 运动规划算法,深度解析+性能实测jllllyuz20 分钟前
灰狼算法优化的LSSVR程序zhangchaoxies28 分钟前
CSS如何实现移动端视口适配_利用rem与vw单位构建响应式布局