算法原理

  • 这是非监督式算法,即我们不需要对这些进行提前打标。
  • 给定一批数组矩阵,并且确认这些矩阵中选取N个作为中心,训练完成模型。
  • 给定X个数据,然后对这X个数据进行自动分类(确认归属于哪个中心)

代码

  1. from sklearn.cluster import KMeans
  2. import numpy as np
  3. X = np.array([[1, 2], [1, 4], [1, 0], [4, 2], [4, 4], [4, 0]])
  4. kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
  5. print(kmeans.predict([[0, 0], [4, 4]]))
  6. print(kmeans.cluster_centers_)

结果

  • [[1. 2.] [4. 2.]] - 第一个是归类到【1.2】,第二个归类到【4.2】

参考资料