python:merge的用法

目录

1.merge基本语法

2.参数说明

3.示例


在Python的Pandas库中,merge 函数是一种常用的工具,用于根据一个或多个键将两个或多个DataFrame对象合并在一起。 以下是**merge**函数的基本用法和参数解释:

1.merge基本语法

python 复制代码
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
         left_index=False, right_index=False, sort=False,
         suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

2.参数说明

  • left: 左侧的DataFrame对象。
  • right: 右侧的DataFrame对象。
  • how : 指定合并方式,可选值有:
    • 'inner'(默认):内连接,只包含两个DataFrame中键相匹配的行。
    • 'left':左连接,包含左侧DataFrame的所有行,右侧无匹配时填充NaN。
    • 'right':右连接,包含右侧DataFrame的所有行,左侧无匹配时填充NaN。
    • 'outer':外连接,包含两个DataFrame的所有行,无匹配时填充NaN。
  • on: 指定用于连接的列名(或列名列表),左右DataFrame中需有相同列名。
  • left_on / right_on: 分别指定左侧和右侧DataFrame中用于连接的列名。
  • left_index / right_index : 是否使用左侧或右侧的索引作为连接键,默认为**False**。
  • sort : 是否对结果进行排序,默认为**False**。
  • suffixes: 当左右DataFrame中有重名列但未被用作连接键时,为这些列添加的后缀。
  • copy : 是否复制数据,默认为**True**。
  • indicator : 是否添加一列 _merge 来标记行的来源,默认为**False** 。可选值有'left_only', 'right_only', 'both'
  • validate : 验证合并操作是否合法,比如可以设置为'one_to_one''one_to_many'等。

3.示例

假设我们有两个DataFrame,df1df2,分别代表不同的数据集,且它们有一个或多个共有的列可以作为连接键。

python 复制代码
import pandas as pd

# 示例数据
data1 = {'key': ['A', 'B', 'C', 'D'], 'value1': [1, 2, 3, 4]}
data2 = {'key': ['B', 'D', 'E', 'F'], 'value2': [5, 6, 7, 8]}

df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

# 使用inner join合并
merged_inner = pd.merge(df1, df2, on='key')

# 使用left join合并
merged_left = pd.merge(df1, df2, on='key', how='left')

# 使用right join合并
merged_right = pd.merge(df1, df2, on='key', how='right')

# 使用outer join合并
merged_outer = pd.merge(df1, df2, on='key', how='outer')
相关推荐
CodeCraft Studio21 分钟前
国产化Excel开发组件Spire.XLS教程:在Python中将Pandas DataFrame导出到Excel的详细教程
python·excel·pandas
面向星辰25 分钟前
windows配置hadoop环境
java·开发语言
B站_计算机毕业设计之家1 小时前
python舆情分析可视化系统 情感分析 微博 爬虫 scrapy爬虫技术 朴素贝叶斯分类算法大数据 计算机✅
大数据·爬虫·python·scrapy·数据分析·1024程序员节·舆情分析
B站_计算机毕业设计之家1 小时前
基于python人脸识别系统 人脸检测 实时检测 深度学习 Dlib库 ResNet深度卷积神经网络 pyqt设计 大数据(源码)✅
python·深度学习·目标检测·计算机视觉·信息可视化·人脸识别·1024程序员节
汤姆yu1 小时前
2026版基于python大数据的电影分析可视化系统
大数据·python·1024程序员节·电影分析可视化
Elieal1 小时前
Java的Collection 集合体系详解
java·开发语言
Pa2sw0rd丶1 小时前
Python 循环导入详解:为什么会导致生产环境崩溃及企业级解决方案
后端·python
梨轻巧2 小时前
Maya Python入门:创建locator、getAttr() 获取属性、setAttr() 设置属性、定位xform()
python·maya
charlie1145141912 小时前
HTML 理论笔记
开发语言·前端·笔记·学习·html·1024程序员节
Xxxx. .Xxxx2 小时前
Classwork 5 - Check the HTML Tags
python