| 实际-真 | 实际-假 | |
|---|---|---|
| 判定-真 | 98 | 120 |
| 判定-假 | 150 | 128 |
混淆矩阵是表示分类器性能的一种表格方式。它的几个度量指标均基于真阳性(TP)、真阴性(TN)、假阳性(FP)、假阴性(FN)。
- 真阳性(TP):正确判定为真的数量。即实际为真,也判定为真。
- 真阴性(TN):正确判定为假的数量。即实际为假,也判定为假。
- 假阳性(FP):判定为真,但实际为假,属于判定错误。
- 假阴性(FN):判定为假,但实际为真,属于判定错误。
精度accuracy
精度是正确的阳性结果数与预测为阳性结果数之比:
精度的范围为[0, 1.0],精度值越高越好。高精度只意味着,当我们预测正类时,我们对它的预测时精确的。但这不意味着我们在不检测这个类时它也是准确的。
召回率recall
召回率是指正确阳性结果的数量除以所有相关样本。
召回率的范围为[0, 1.0]。在图像目标检测等问题上(要求尽可能识别到目标对象,哪怕因此而返回一些非目标对象),召回率是个重要的指标。
F1评分
F1分数是精度和召回率的调和平均数。F1的范围是[0, 1.0],表示分类器的精度和鲁棒性。F1分数越大,模型的整体性能越好。
ROC曲线
ROC曲线,受试者工作特征(Receiving Operating Characteristic, ROC)曲线。AUC的是ROC曲线下的面积,AUC是衡量二分类问题最常用的度量指标之一。
在进行分类时,通常是使用阈值来进行分类判定——高于阈值时判定为阳性,低于阈值时判定为阴性。改变阈值的大小将改变分类器的性能,即改变TP、FP、TN、FN的数量,从而改变总体的分类性能。ROC曲线实际上就是在修改阈值的过程中,得到的关于假阳性率(FPR)和真阳性率(TPR)关系的曲线。
- 灵敏度(也称真阳性率,TPR):被正确识别为阳性的阳性数据点相对于所有阳性数据点的比例。即召回率recall。
- 特异性(也称为假阳性率,FPR):被判定为阳性的阴性数据点相对于所有阴性数据点的比例。

TPR和FPR的取值范围都是 [0, 1.0],通过改变分类阈值来绘制该图像。因此AUC的值范围也是[0, 1.0]。AUC值越大,模型的性能越好。
