当前位置：首页 > 脚本中心 > python > 详细页面

Pandas merge合并两个DataFram的实现

时间：2023-03-17来源：系统城装机大师作者：佚名

Pandas merge

pandas.merge()是pandas库中用于合并两个或多个DataFrame对象的函数，其常用的参数有以下几个：

left：要合并的左侧DataFrame。
right：要合并的右侧DataFrame。
how：指定合并方式，包括‘left’、‘right’、‘outer’和‘inner’四种。
on：指定按照哪些列进行合并，可以是单个列名或包含多个列名的列表。
left_on和right_on：指定左侧和右侧DataFrame中进行合并的列名，如果两个DataFrame中的列名不同，需要通过这两个参数指定。
suffixes：指定当两个DataFrame中有相同列名时，为区分而添加的后缀。

示例代码

1
2
3
4
5
6
7
8
9 import pandas as pd

# 创建两个DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})

# 通过key列合并两个DataFrame
merged = pd.merge(df1, df2, on='key')
print(merged)

运行结果：

key value_x value_y
0 B 2 5
1 D 4 6

在这个例子中，创建了两个DataFrame对象df1和df2，它们都有一个名为’key’的列。使用pd.merge()函数将这两个DataFrame对象按照’key’列进行合并，并将结果存储在merged变量中。最后，输出了合并后的结果，其中value_x和value_y分别代表合并前的df1和df2中的’value’列。

保留左边的DataFram

如果只想考虑左侧的DataFrame对象，在pandas.merge()函数中可以设置how=‘left’参数来实现。具体来说，how参数控制了两个DataFrame对象之间的合并方式，可以取值为’left’、‘right’、‘outer’和’inner’。当取值为’left’时，pandas.merge()函数会将左侧DataFrame对象中所有的行保留，并在合并后的DataFrame对象中添加右侧DataFrame对象中能够和左侧DataFrame对象匹配的行。

下面是一个示例代码：

1
2
3
4
5
6
7
8
9
10 import pandas as pd

# 创建两个DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})

# 只考虑左侧的DataFrame对象
merged = pd.merge(df1, df2, on='key', how='left')

print(merged)