Pandas实战100例 | 案例 53: 处理缺失值

发布时间:2024年01月16日

案例 53: 处理缺失值

知识点讲解

在数据分析中,处理缺失值是一个常见且重要的步骤。Pandas 提供了多种方法来处理 DataFrame 中的缺失值,包括填充缺失值和删除含有缺失值的行或列。

  • 填充缺失值: 使用 fillna 方法可以将缺失值替换为指定的值。
  • 删除缺失值: 使用 dropna 方法可以删除含有缺失值的行或列。
示例代码
# 准备数据和示例代码的运行结果,用于案例 53

# 示例数据
data_missing_values_handling = {
    'A': [1, 2, None, 4],
    'B': [None, 2, 3, 4]
}
df_missing_values_handling = pd.DataFrame(data_missing_values_handling)

# 处理缺失值
df_filled = df_missing_values_handling.fillna(0)
df_dropped = df_missing_values_handling.dropna()

df_missing_values_handling, df_filled, df_dropped


在这个示例中,我们首先使用 fillna 方法将所有缺失值替换为 0。然后,我们使用 dropna 方法删除了包含缺失值的行。

示例代码运行结果

原始 DataFrame (df_missing_values_handling):

     A    B
0  1.0  NaN
1  2.0  2.0
2  NaN  3.0
3  4.0  4.0

填充缺失值后 (df_filled):

     A    B
0  1.0  0.0
1  2.0  2.0
2  0.0  3.0
3  4.0  4.0

删除含缺失值的行 (df_dropped):

     A    B
1  2.0  2.0
3  4.0  4.0

这个案例展示了如何在 Pandas 中处理缺失值,这对于数据清洗和准备是非常重要的。

文章来源:https://blog.csdn.net/PoGeN1/article/details/135610829
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。