Pandas 的 groupby
和 agg
方法使得对数据分组后应用多个聚合函数成为可能。这在数据分析中非常有用,可以快速得到分组统计数据。
groupby
方法对数据进行分组。agg
方法并传递一个包含多个聚合函数的列表,可以对每个组应用多个聚合操作。# 准备数据和示例代码的运行结果,用于案例 40
# 示例数据
data_aggregation = {
'Group': ['A', 'A', 'B', 'B', 'C', 'C'],
'Values': [10, 15, 20, 25, 30, 35]
}
df_aggregation = pd.DataFrame(data_aggregation)
# 分组并应用多个聚合函数
aggregated_data = df_aggregation.groupby('Group').agg(['sum', 'mean', 'max'])
df_aggregation, aggregated_data
在这个示例中,我们根据 Group
列对数据进行分组,并对每个组应用了求和 (sum
)、平均 (mean
) 和最大值 (max
) 三个聚合函数。
原始 DataFrame (df_aggregation
):
Group Values
0 A 10
1 A 15
2 B 20
3 B 25
4 C 30
5 C 35
分组并聚合后的结果 (aggregated_data
):
Values
sum mean max
Group
A 25 12.5 15
B 45 22.5 25
C 65 32.5 35
这个结果显示了每个组的总和、平均值和最大值。通过这种方式,可以快速对数据进行多维度的分析。