Pandas 的 groupby
方法允许你对数据进行分组,并对每个分组应用聚合函数,如求和、求平均、求最大值等。这对于分类数据的分析非常重要。
groupby
后使用 sum
方法可以对每个分组的数值求和。groupby
后使用 mean
方法可以计算每个分组的平均值。groupby
后使用 max
方法可以找到每个分组的最大值。# 准备数据和示例代码的运行结果,用于案例 22
# 示例数据
data_grouped_operations = {
'Category': ['A', 'B', 'A', 'B', 'C', 'C', 'C'],
'Values': [10, 15, 20, 25, 5, 10, 15]
}
df_grouped_operations = pd.DataFrame(data_grouped_operations)
# 分组运算
grouped_sum = df_grouped_operations.groupby('Category').sum()
grouped_mean = df_grouped_operations.groupby('Category').mean()
grouped_max = df_grouped_operations.groupby('Category').max()
df_grouped_operations, grouped_sum, grouped_mean, grouped_max
在这个示例中,我们首先根据 Category
列对 DataFrame 进行分组。然后,我们对每个分组计算了总和、平均值和最大值。
原始 DataFrame (df_grouped_operations
):
Category Values
0 A 10
1 B 15
2 A 20
3 B 25
4 C 5
5 C 10
6 C 15
分组后的求和 (grouped_sum
):
Values
Category
A 30
B 40
C 30
分组后的平均值 (grouped_mean
):
Values
Category
A 15.0
B 20.0
C 10.0
分组后的最大值 (grouped_max
):
Values
Category
A 20
B 25
C 15
这个案例说明了如何对分类数据进行有效的分组和聚合运算,这对于理解数据集中的不同类别是非常有用的。