算法原理
- 这是非监督式算法,即我们不需要对这些进行提前打标。
- 给定一批数组矩阵,并且确认这些矩阵中选取N个作为中心,训练完成模型。
- 给定X个数据,然后对这X个数据进行自动分类(确认归属于哪个中心)
代码
from sklearn.cluster import KMeans
import numpy as np
X = np.array([[1, 2], [1, 4], [1, 0], [4, 2], [4, 4], [4, 0]])
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
print(kmeans.predict([[0, 0], [4, 4]]))
print(kmeans.cluster_centers_)
结果
- [[1. 2.] [4. 2.]] - 第一个是归类到【1.2】,第二个归类到【4.2】