在数据处理过程中,有时需要根据条件对数据进行转换或计算。Pandas 的 apply
方法允许你对 DataFrame 的每一行或列应用一个自定义函数,实现复杂的逻辑。
apply
方法结合 lambda
函数,可以根据条件对数据进行转换或计算。# 重新导入 pandas 并准备数据和示例代码的运行结果,用于案例 55
import pandas as pd
# 示例数据
data_condition_application = {
'A': [10, 20, 30, 40, 50],
'B': [5, 15, 25, 35, 45]
}
df_condition_application = pd.DataFrame(data_condition_application)
# 应用条件
df_condition_application['C'] = df_condition_application.apply(lambda row: row['A'] + row['B'] if row['A'] > 20 else row['A'], axis=1)
df_condition_application
在这个示例中,我们创建了一个新列 C
,其值基于对每行的条件判断:如果列 A
的值大于 20,则 C
是 A
和 B
的和;否则,C
与 A
相同。
A B C
0 10 5 10
1 20 15 20
2 30 25 55
3 40 35 75
4 50 45 95
这个结果展示了基于条件的数据转换。这种方法在数据处理中非常有用,尤其是在需要根据行或列的值应用复杂逻辑时。