pandas数据合并与重塑——merge

发布时间:2024年01月10日

数据合并与重塑有merge,join,concat三种方法,本文先对merge进行讲解

目录

1.merge参数概览

2.左右内外连接概念讲解

(1)左连接

(2)右连接

(3)内连接

(4)外连接

3.merge数据合并

(1)当两个表用来做连接键的列名都相同时(以左连接为例)

A使用方法:

B数据合并前后对比:

(2)当两个表用来做连接键的列名都不相同时(本次默认内连接)

A使用方法

B数据合并前后对比

1.merge参数概览

参数介绍
how连接方式(左连接left,右连接right,内连接inner,外连接outer)默认内连接
on用来做连接键的列名(两表必须相同)
left_on左表用来做连接键的列名
right_on右表用来做连接键的列名
left_indexTrue表示左表索引列作为连接键
right_indexTrue表示右表索引列作为连接键
suffix给两表的列加后缀进行区分

2.左右内外连接概念讲解

pandas中的左右内外连接和mysql中的大致相同,学过mysql的更容易理解

现在有两张表:表1和表2

(1)左连接

以表1为准,将表2中与表1能根据连接键对应的数据与表1合并,和表1对应不上的数据则丢弃,在此过程中表1的数据是被完全保留下的

(2)右连接

与左连接相反,以表2为准,将表1中与表2能根据连接键对应的数据与表2合并,和表2对应不上的数据则丢弃,在此过程中表2的数据是被完全保留下的

(3)内连接

将表1和表2中根据连接键对应两边都有的数据合并,在此过程中表1只保留了能和表2对应的数据,表2也只保留下了能和表1对应的数据,有点类似于数学中的交集

(4)外连接

表1和表2的数据根据连接键对应合并,在此过程中表1表2的数据全都保留下来,相当于数学中的并集

3.merge数据合并

首先将两个表的数据进行读取

import pandas as pd
adress1="D:/pandas练习文件/merge1.xlsx"
adress2="D:/pandas练习文件/merge2.xlsx"
data1=pd.read_excel(adress1)
data2=pd.read_excel(adress2)?

(1)当两个表用来做连接键的列名都相同时(以左连接为例)

A使用方法:

pd.merge(数据1,数据2,on=" ",how=" ")

all_data=pd.merge(data1,data2,on="姓名",how="left")

B数据合并前后对比:

(2)当两个表用来做连接键的列名都不相同时(本次默认内连接)

A使用方法

pd.merge(数据1,数据2,left_on="",right_on="")

all_data=pd.merge(data1,data2,left_on="姓名1",right_on="姓名2")

B数据合并前后对比

文章来源:https://blog.csdn.net/2302_80061155/article/details/135488964
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。