Pandas实战100例 | 案例 42: 数据过滤

发布时间:2024年01月14日

案例 42: 数据过滤

知识点讲解

数据过滤是数据处理中的一个基本任务。在 Pandas 中,你可以使用布尔索引来过滤符合特定条件的数据行。

  • 数据过滤: 通过结合条件表达式(例如 df['A'] > 2df['B'] < 5),可以创建一个布尔索引,用于选择数据集中满足这些条件的行。
示例代码
# 准备数据和示例代码的运行结果,用于案例 42

# 示例数据
data_filtering = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 3, 4, 5, 6]
}
df_filtering = pd.DataFrame(data_filtering)

# 数据过滤
filtered_data = df_filtering[(df_filtering['A'] > 2) & (df_filtering['B'] < 5)]

df_filtering, filtered_data


在这个示例中,我们选择了 A 列值大于 2 且 B 列值小于 5 的行。

示例代码运行结果

原始 DataFrame (df_filtering):

   A  B  C
0  1  5  2
1  2  4  3
2  3  3  4
3  4  2  5
4  5  1  6

过滤后的数据 (filtered_data):

   A  B  C
2  3  3  4
3  4  2  5
4  5  1  6

这个结果展示了如何根据多个条件过滤数据。数据过滤是数据分析和数据清洗中非常重要的一步。

文章来源:https://blog.csdn.net/PoGeN1/article/details/135568740
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。