k近邻法

浏览 149 扫码分享 2023-11-22 12:41:47

k-nearest neighbor?
感性认知knn
理性认知knn
- k近邻模型
- k近邻法学习算法工作流程
参考

k-nearest neighbor?

感性认知knn

k近邻法 - 图1 算法的思想是 “物以类聚，人以群分”

比如，观察下面这张图，试着判断一下外星人形状的东西属于哪一类？

很显然，我们应该将它归于马一类

理性认知knn

k近邻模型

k近邻法 - 图3 算法需要确定以下4个指标

训练集
距离度量
的取值
分类决策标准

训练集

距离度量

特征空间中两个实例点的距离是两个点相似程度的反映
定义距离，
- 当称作曼哈顿距离，
- 当称作欧氏距离，
- 当代表了各个坐标的最大值
  k的取值
若值较小，可以理解为用较小的一片区域的训练实例来进行预测，但这样会导致预测结果对近邻的实例点非常敏感，如若邻近的点恰好是噪声，预测就会出错
- 优点：“学习”的近似误差会减小
- 缺点：“学习”的估计误差会增大，容易过拟合
若值较大，可以理解为用较大的一片区域的训练实例来进行预测，这就意味值与输入实例较远的训练实例也会对预测起作用，从而使得预测出错
- 优点：“学习”的估计误差会减小
- 缺点：“学习”的近似误差会增大

用下面这幅图来说明 k近邻法 - 图17 值的重要性，图中的灰色点到底是属于红色还是绿色？

要想知道灰色点属于哪一类，这取决于 k近邻法 - 图19 的取值

k近邻法 - 图20 值一般取一个比较小的数值，例如采用交叉验证法来选择最优的 k近邻法 - 图21 值

分类决策标准

在中的分类决策规则往往都是多数表决，即由输入实例的个邻近的训练实例中多数类决定输入实例的类

比如，当 k近邻法 - 图23 值确定后，就可以通过距离度量来计算灰色点归属于哪一类

k近邻法学习算法工作流程

输入：训练数据集 k近邻法 - 图25 其中 k近邻法 - 图26 ， k近邻法 - 图27 , k近邻法 - 图28 代表类别
输出：实例 k近邻法 - 图29 所属的类别 k近邻法 - 图30

根据给定的距离度量，在训练集中找出与最邻近的个点，涵盖这个点的领域称作
在中根据分类决策标准 (比如多数表决) 决定的类别

k近邻法 - 图39 近邻法的特殊情况为 k近邻法 - 图40 的情形，称作最近邻算法；对于输入的实例点 k近邻法 - 图41 ，最近邻法将训练数据中与 k近邻法 - 图42 最领近的点的类作为 k近邻法 - 图43 的类

参考

统计学习方法
medium.com
heartbeat.fritz.ai

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录