1、读取excel /csv及指定sheet:
pd.read_excel=("路径",sheetname="xx")
修改列名df.rename
修改字符串类型到数字 pandas.to_numeric()
2、删除drop、去重drop_duplicates
(1)空值所在行/列
行:df.dropna(axis=0, how='any', inplace=True)
列:df.dropna(axis=1, how='any', inplace=True)
(2)删除指定列为空的行
df = df.dropna(subset=['列名')
(3)删除指定行/列
df=df.drop(['列名'],axis=1) ;df=df.drop(cloumns=['列名'])
(4)去重
df=df.drop_duplicates(subset=['列名1','列名2'],keep=‘’,inplace=xx)
3、新增一列/行
(1)在最后新增一列固定值 df['列名']='值'
4、新建一个表,另存为
保存到csv就 dataframe.to_csv() ;保存到excel就dataframe.to_excel()
writer=pd.excelwriter('路径')
df.to_excel(writer)
writer.save()
writer.close()
自定义函数
操作行/列 apply
列之间的加减乘除 df["列名"].apply(lambda x:x["a"]+x["b"],axis=1)
指定列求和汇总:xx = df['列名'].sum()
5、纵向匹配 拼接 merge
6、分组汇总+使用函数 group by
分组:df.groupby(['列名'])
分组计数:df.groupby(['列名']).count()
分组求和:df.groupby(['列名']).sum()['列名']