K-means算法

浏览 384 扫码分享 2023-05-03 16:45:41

缺点
优点
K-means的优化

随机选取K个样本点，作为聚类中心，然后遍历数据，找到每个数据与哪个聚类中心较近，则该数据划分为对应的类。每遍历完一次数据就使用求均值的方法得到每个类的聚类中心；直到聚类中心不再发生变化，K-means聚类算法已经完成分类任务。

缺点

分类结果会受初始选取的个点的位置影响
分类结果容易受到离群点的影响

优点
对于大数据集，具有相对的可伸缩性和高效性
对于大数据集，计算复杂度低
算法虽然经常以局部最优结束，但是往往满足需求

K-means的优化

对数据进行归一化处理，避免某一维度的方差过大产生影响
对离群点数据进行处理
合理选择K值
1. 手肘法

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录