- 二分类问题常见的评价指标有
- Accuracy 准确率
- Precision 查准率
- Recall 查全率/召回率
- F1-Score Precision和Recall的调和平均
多分类问题,也有类似的概念,但是求取的方式有所变化,可以分为
- micro
- macro
- weighted等
micro方法下的precision和recall都等于accuracy
如何理解这句话呢?
在一个多分类的问题里面,我们使用micro方式来获取评价指标。
假设预测节点个数是N,里面的预测正确的值是M,里面总的分类数是A个。那么
accuracy = M / N
我们会把多分类变为A个二分类问题,形成A个混淆矩阵,最终加和形成如下的大混淆矩阵:
混淆矩阵 | 预测 | ||
---|---|---|---|
真(正) | 假(负) | ||
实际 | 真(正) | TP(M) | FN(N-M) |
假(负) | FP(N-M) | TN |
因为N个预测中,M个是一致,N-M个是不一致的,
每一个不一致(以A-B为例),都会在以A分类和以B分类为单位的小混淆矩阵中,形成一组对应的FP或者FN
最终加和后FP=N-M,FN=N-M
因此我们的
precision = TP/(TP + FN) = M /N
recall = TP/(TP + FP) = M /N
所以,可以得出结论 micro方式下的precision、recall和accuracy是完全相等的