聚类算法是一类无监督学习算法,应用于无标签的数据。
    聚类算法可以将相似的对象归到同一个簇中,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离。
    image.png image.png

    聚类算法有很多,其中应用最广泛的一种算法是 K-Means 算法:
    聚类算法 - K 均值(K-Means)
    而对于非球状的数据分布,可能并不适合用 K-Means 算法,此时可以用 DBSCAN 算法:
    聚类算法 - DBSCAN