【持更】python数据处理-学习笔记

发布时间:2023年12月18日

1、读取excel /csv及指定sheet:

pd.read_excel=("路径",sheetname="xx")

修改列名df.rename

修改字符串类型到数字 pandas.to_numeric()

2、删除drop、去重drop_duplicates

(1)空值所在行/列

行:df.dropna(axis=0, how='any', inplace=True)

列:df.dropna(axis=1, how='any', inplace=True)

(2)删除指定列为空的行

df = df.dropna(subset=['列名')

(3)删除指定行/列

df=df.drop(['列名'],axis=1) ;df=df.drop(cloumns=['列名'])

(4)去重

df=df.drop_duplicates(subset=['列名1','列名2'],keep=‘’,inplace=xx)

3、新增一列/行

(1)在最后新增一列固定值 df['列名']='值'

4、新建一个表,另存为

保存到csv就 dataframe.to_csv() ;保存到excel就dataframe.to_excel()

writer=pd.excelwriter('路径')

df.to_excel(writer)

writer.save()

writer.close()

自定义函数

操作行/列 apply

列之间的加减乘除 df["列名"].apply(lambda x:x["a"]+x["b"],axis=1)

指定列求和汇总:xx = df['列名'].sum()

5、纵向匹配 拼接 merge

6、分组汇总+使用函数 group by

分组:df.groupby(['列名'])

分组计数:df.groupby(['列名']).count()

分组求和:df.groupby(['列名']).sum()['列名']

文章来源:https://blog.csdn.net/clairliu/article/details/134938429
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。