在数据分析中,处理缺失值是一个常见且重要的步骤。Pandas 提供了多种方法来处理 DataFrame 中的缺失值,包括填充缺失值和删除含有缺失值的行或列。
fillna
方法可以将缺失值替换为指定的值。dropna
方法可以删除含有缺失值的行或列。# 准备数据和示例代码的运行结果,用于案例 53
# 示例数据
data_missing_values_handling = {
'A': [1, 2, None, 4],
'B': [None, 2, 3, 4]
}
df_missing_values_handling = pd.DataFrame(data_missing_values_handling)
# 处理缺失值
df_filled = df_missing_values_handling.fillna(0)
df_dropped = df_missing_values_handling.dropna()
df_missing_values_handling, df_filled, df_dropped
在这个示例中,我们首先使用 fillna
方法将所有缺失值替换为 0。然后,我们使用 dropna
方法删除了包含缺失值的行。
原始 DataFrame (df_missing_values_handling
):
A B
0 1.0 NaN
1 2.0 2.0
2 NaN 3.0
3 4.0 4.0
填充缺失值后 (df_filled
):
A B
0 1.0 0.0
1 2.0 2.0
2 0.0 3.0
3 4.0 4.0
删除含缺失值的行 (df_dropped
):
A B
1 2.0 2.0
3 4.0 4.0
这个案例展示了如何在 Pandas 中处理缺失值,这对于数据清洗和准备是非常重要的。