• 二分类问题常见的评价指标有
      • Accuracy 准确率
      • Precision 查准率
      • Recall 查全率/召回率
      • F1-Score Precision和Recall的调和平均
    • 多分类问题,也有类似的概念,但是求取的方式有所变化,可以分为

      • micro
      • macro
      • weighted等
    • micro方法下的precision和recall都等于accuracy

    如何理解这句话呢?
    在一个多分类的问题里面,我们使用micro方式来获取评价指标。
    假设预测节点个数是N,里面的预测正确的值是M,里面总的分类数是A个。那么
    accuracy = M / N

    我们会把多分类变为A个二分类问题,形成A个混淆矩阵,最终加和形成如下的大混淆矩阵:

    混淆矩阵 预测
    真(正) 假(负)
    实际 真(正) TP(M) FN(N-M)
    假(负) FP(N-M) TN

    因为N个预测中,M个是一致,N-M个是不一致的,
    每一个不一致(以A-B为例),都会在以A分类和以B分类为单位的小混淆矩阵中,形成一组对应的FP或者FN
    最终加和后FP=N-M,FN=N-M
    因此我们的
    precision = TP/(TP + FN) = M /N
    recall = TP/(TP + FP) = M /N

    所以,可以得出结论 micro方式下的precision、recall和accuracy是完全相等的