混淆矩阵及F1得分AUC得分 - 《AI算法学习》

	实际-真	实际-假
判定-真	98	120
判定-假	150	128

混淆矩阵是表示分类器性能的一种表格方式。它的几个度量指标均基于真阳性（TP）、真阴性（TN）、假阳性（FP）、假阴性（FN）。

精度accuracy

精度是正确的阳性结果数与预测为阳性结果数之比：

混淆矩阵及F1得分AUC得分 - 图1

精度的范围为[0, 1.0]，精度值越高越好。高精度只意味着，当我们预测正类时，我们对它的预测时精确的。但这不意味着我们在不检测这个类时它也是准确的。

召回率是指正确阳性结果的数量除以所有相关样本。

混淆矩阵及F1得分AUC得分 - 图2

召回率的范围为[0, 1.0]。在图像目标检测等问题上（要求尽可能识别到目标对象，哪怕因此而返回一些非目标对象），召回率是个重要的指标。

F1分数是精度和召回率的调和平均数。F1的范围是[0, 1.0]，表示分类器的精度和鲁棒性。F1分数越大，模型的整体性能越好。

混淆矩阵及F1得分AUC得分 - 图3

ROC曲线，受试者工作特征（Receiving Operating Characteristic， ROC）曲线。AUC的是ROC曲线下的面积，AUC是衡量二分类问题最常用的度量指标之一。

在进行分类时，通常是使用阈值来进行分类判定——高于阈值时判定为阳性，低于阈值时判定为阴性。改变阈值的大小将改变分类器的性能，即改变TP、FP、TN、FN的数量，从而改变总体的分类性能。ROC曲线实际上就是在修改阈值的过程中，得到的关于假阳性率（FPR）和真阳性率（TPR）关系的曲线。

混淆矩阵及F1得分AUC得分 - 图4
混淆矩阵及F1得分AUC得分 - 图5

TPR和FPR的取值范围都是 [0, 1.0]，通过改变分类阈值来绘制该图像。因此AUC的值范围也是[0, 1.0]。AUC值越大，模型的性能越好。