pandas的merge使用

发布时间:2024年01月19日

pandas库中的merge()函数是用于合并两个DataFrame对象的方法。

merge()函数的常用参数如下:

  • left:表示第一个DataFrame对象。
  • right:表示第二个DataFrame对象。
  • how:表示合并的方式,默认为’inner’(交集),其他可选值有’outer’(并集)、‘left’(左连接)、‘right’(右连接)。
  • on:表示用于合并的列名,可以是单个列名或包含多个列名的列表。
  • left_on和right_on:表示合并时左右DataFrame对象中用于合并的列名,如果左右两个DataFrame对象中的列名不同,则需要分别指定。
  • suffixes:表示合并后重复列名的后缀,默认为(‘_x’, ‘_y’)。

pandas中的merge函数可以根据指定的列或索引将两个DataFrame对象进行合并。以下是merge函数的常用参数和使用方法:

  1. 基本用法:
df_merged = pd.merge(df1, df2, on='column_name')

此用法将df1和df2按照指定的列名"column_name"进行合并,并返回一个新的合并后的DataFrame对象df_merged。

  1. 指定合并方式:
df_merged = pd.merge(df1, df2, on='column_name', how='inner')

merge函数的how参数可以设置合并的方式,包括’inner’、‘outer’、‘left’、‘right’。默认为’inner’,表示取交集。其他方式分别表示取并集、以df1为准、以df2为准。

  1. 指定合并的列名:
df_merged = pd.merge(df1, df2, left_on='column1', right_on='column2')

如果要合并的列名不同,可以使用left_on和right_on参数分别指定df1和df2中要合并的列名。

  1. 多列合并:
df_merged = pd.merge(df1, df2, on=['column1', 'column2'])

可以通过一个列表指定多个列名,进行多列合并。

  1. 处理缺失值:
df_merged = pd.merge(df1, df2, on='column_name', how='outer')

通过设置how参数为’outer’,可以将缺失值填充为NaN。

以上是merge函数的一些常用用法,详细的参数和用法可以参考pandas官方文档。

文章来源:https://blog.csdn.net/leshen_88/article/details/135690670
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。