聚类

浏览 140 扫码分享 2023-11-22 00:21:27

1.K-Means

1.K-Means

1.1API介绍

     - estimator = sklearn.cluster.KMeans(n_clusters=8)
        - 参数n_clusters
           - 簇心数，缺省值8
        - 方法：
           - estimator.fit(x)
           - estimator.predict(x)
           - estimator.fit_predict(x)
              - 计算簇心并预测每个样本属于哪个类别，相当于先fit再predict

1.2.评估方法

     1. 误差平方和SSE
        1. 越小越好
        1. 拐点法（肘部法）：下降率突然变缓处，认为是最佳K值
     2. SC，[-1,-1]值越大越好
     2. CH，越大越好：追求簇心少，同时获得较好聚类效果

1.3.改进

     1. Canopy
        1. 通过绘制同心圆，进行k值选择刷选
        1. 带参数t1,t2
     2.  K-means++
        1. 保证下一个簇心距离当前簇心最远
     3. 二分k-means
        1. 分割数据，设置SSE阈值，不满足继续分割
     4. K-medoids：抗噪音
     4. Kernel k-means：映射到高维
     4. ISODATA：动态簇心数
     4. Mini batch k-means：大数据分批聚类

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录