pandas dataframe 怎么保留重复的行

要保留Pandas DataFrame 中的重复行,可以使用duplicated()方法和布尔索引。

下面是一个示例,演示如何实现这个功能:

python 复制代码
import pandas as pd

# 创建一个DataFrame对象
df = pd.DataFrame({'A': ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']})

# 使用duplicated()方法查找重复行
duplicates = df.duplicated()

# 使用布尔索引选择重复行
duplicate_rows = df[duplicates]

print(duplicate_rows)

运行结果

python 复制代码
A
2   apple
4  banana
5  banana

在上述代码中,我们首先使用duplicated()方法查找DataFrame中的重复行,返回一个布尔Series,其中值为True表示对应的行是重复的。然后,我们使用这个布尔Series作为布尔索引,从DataFrame中选择重复的行,并将结果存储在duplicate_rows变量中。


如果你想保留Pandas DataFrame中的所有重复行,可以使用duplicated()方法和keep参数。

下面是一个示例,演示如何实现这个功能:

python 复制代码
import pandas as pd

# 创建一个DataFrame对象
df = pd.DataFrame({'A': ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']})

# 使用duplicated()方法查找重复行,并保留所有重复行
duplicates = df.duplicated(keep=False)

# 使用布尔索引选择重复行
duplicate_rows = df[duplicates]

print(duplicate_rows)

运行上述代码会输出下面的结果:

python 复制代码
A
0   apple
2   apple
4  banana
5  banana

在上述代码中,我们使用duplicated()方法查找DataFrame中的重复行,并通过将keep参数设置为False来保留所有重复行。该方法返回一个布尔Series,其中值为True表示对应的行是重复的。

然后,我们使用这个布尔Series作为布尔索引,从DataFrame中选择重复的行,并将结果存储在duplicate_rows变量中。

这样,duplicate_rows就是一个包含了所有重复行的新DataFrame对象。

相关推荐
zhangfeng113327 分钟前
SothisAI 是曙光给超算/智算中心用的「AI 任务管理+算力调度平台
人工智能
祁_z32 分钟前
大模型轻量化:模型格式选型(ONNX/GGUF/TFLite) + 压缩三剑客(量化/剪枝/蒸馏)+ 大模型推理执行流程介绍
算法·机器学习·剪枝·量化·蒸馏·大模型轻量化
金融Tech趋势派41 分钟前
2026企业微信AI服务商实测:微盛·企微管家领跑私域客户运营赛道
大数据·人工智能·企业微信
武汉知识图谱科技43 分钟前
从材料到实物:神经符号AI如何重构轨道车辆吸能结构仿真流程
人工智能·知识图谱
青岛前景互联信息技术有限公司1 小时前
又到一年开学季,大学校园安全管理中的突出问题分析
大数据·人工智能·物联网
折哥的程序人生 · 物流技术专研1 小时前
从“卡死”到“跑通”:WMS机器学习全流程实战排坑记
数据库·人工智能·机器学习
AC赳赳老秦1 小时前
可视化方案提效:用 OpenClaw 对接 XMind/ProcessOn,自动生成流程图、架构图、工作脑图
人工智能·深度学习·caffe·xmind·processon·deepseek·openclaw
coderyi1 小时前
理解AI Code Agent
人工智能·agent
Clark111 小时前
# 十年 C++ 后端 GAP 六个月,写了一个近 3 万行的LLM-TFFInfer推理框架项目解析(四)——Tensor 张量系统与内存抽象(上)
人工智能
jarvisuni1 小时前
Claude“山寨版”来了,支持中文,可配“任意模型”
人工智能·ai编程