OOT(Out of Time)是在建模过程中用于描述模型在时间维度上的性能变化的术语。当模型在训练时使用的数据集与实际应用场景中的数据分布发生差异,特别是在时间上存在间隔时,就可能出现OOT问题。
OOT通常指的是模型在训练时使用的数据集与将来要在实际应用中使用的数据集有显著的时间差异,导致模型在未来的预测性能下降。这种情况可能由于数据的时效性、外部环境的变化等原因引起。
解决OOT问题的一种常见方法是使用群体稳定性指数(Population Stability Index,PSI)等工具来监测模型在不同时间段或数据分布上的性能变化。通过在模型上线前和上线后对模型性能进行监测,可以及时发现潜在的OOT问题并进行调整。
预防OOT问题的方法包括:
通过这些方法,可以提高模型对未来数据的适应能力,减少由于时间上的变化而导致的性能下降问题。
PSI 指标就是群体稳定性指数(Population Stability Index)
通过 PSI 指标,可以得到不同样本(不同时间段给到模型的样本)下,模型在各分数段分布的稳定性。
用于衡量两个群体(比如两个时间点、两个子群体等)之间稳定性的指标。通常,PSI被广泛用于评估信用风险模型、预测模型等在不同时间点或不同群体中的性能变化。
PSI = SUM ( 实际占比 - 预期占比 ) * ln ( 实际占比 / 预期占比 )
P actual,i
- 表示实际分布中第 i
个分箱的占比P expected,i
- 表示期望分布中第 i
个分享的占比通常,期望分布可以是参考的基准分布,比如在时间点1的分布作为基准,而实际分布是在时间点2的分布。
结果:
通常,一些经验性的阈值可以用来解释PSI的结果,比如:
PSI<0.1
: 稳定性很高0.1≤PSI<0.25
: 稳定性一般PSI≥0.25
: 稳定性较差稳定性是一个相对的概念,只有通过对比,才能知道模型是不是稳定。所以,想要计算模型的稳定性,需要先有一个参照物。
在信用评分模型中,为了进行对比,至少需要两个分布结果,一个是预期分布结果一个是实际分布结果。
流程:
实际占比 - 预期占比
实际占比 / 预期占比
ln(实际占比 / 预期占比)
index = (实际占比 - 预期占比) * ln(实际占比 / 预期占比)
PSI = sum(index1 + index2 + ...+ indexn)