分组后的转换是数据处理中的一项重要功能。使用 Pandas 的 groupby
与 transform
方法,你可以在分组内应用一个函数,同时保持原始数据的形状。
transform
方法应用于 groupby
对象,对每个组内的数据应用同一个函数,并返回一个与组大小相同的结果。# 准备数据和示例代码的运行结果,用于案例 35
# 示例数据
data_grouped_transform = {
'Category': ['A', 'A', 'B', 'B', 'C', 'C'],
'Values': [10, 15, 20, 25, 30, 35]
}
df_grouped_transform = pd.DataFrame(data_grouped_transform)
# 分组转换
grouped_mean = df_grouped_transform.groupby('Category').transform('mean')
df_grouped_transform, grouped_mean
在这个示例中,我们根据 Category
列对数据进行了分组,并计算了每个组的平均值。
原始 DataFrame (df_grouped_transform
):
Category Values
0 A 10
1 A 15
2 B 20
3 B 25
4 C 30
5 C 35
分组转换后的结果 (grouped_mean
):
Values
0 12.5
1 12.5
2 22.5
3 22.5
4 32.5
5 32.5
这个结果展示了每个类别的平均值。分组转换功能在数据标准化、填充缺失值等场景中特别有用。