3.1 k近邻算法 - 图1

    K近邻并没有显式的学习过程,也就是不需要对训练集进行学习。预测过程中直接遍历预测点与所有点的距离,并找到最近的K个点即可。找到K个最近点后,使用多数表决(即投票)的方式确定预测点的类别。式3.1的I为指示函数,当括号内条件为真时I(true)=1,I(false)=0。
    式3.1表示对于每一个类Cj,进行3.1 k近邻算法 - 图2进行求和,就是计算这K个点中有多少个标记为Cj的点,例如K=25,一共有四个类分别为C1、C2、C3、C4,25个点中他们的个数分别有10、5、1、9个,那么最多数目的类别C1就是样本点的预测类别。