链接: 准确率、精确率、召回率、F1值、ROC/AUC整理笔记.
真阳性率(TPR, True positive rate)
TP/(TP+FN),代表分类器预测的正类中实际正实例占所有正实例的比例。
假阳性概率(FPR, False positive rate)
FP/(FP+TN),代表分类器预测的正类中实际负实例占所有负实例的比例。
ROC曲线其实就是以FPR为横坐标,TPR为纵坐标绘制出来的曲线。
语言文字形容:
ROC曲线的绘制步骤如下:
1
假设已经得出一系列样本被划分为正类的概率Score值,按照大小排序。
2
从高到低,依次将“Score”值作为阈值threshold,当测试样本属于正样本的概率大于或等于这个threshold时,我们认为它为正样本,否则为负样本。举例来说,对于某个样本,其“Score”值为0.6,那么“Score”值大于等于0.6的样本都被认为是正样本,而其他样本则都认为是负样本。
3
每次选取一个不同的threshold,得到一组FPR和TPR,以FPR值为横坐标和TPR值为纵坐标,即ROC曲线上的一点。
4
根据3中的每个坐标点,画图。