有监督和无监督的区别
- 有监督学习方法必须要有训练集与测试样本。在训练集中找规律,而对测试样本使用这种规律。而非监督学习没有训练集,只有一组数据,在该组数据集内寻找规律。
2. 有监督学习的方法就是识别事物,识别的结果表现在给待识别数据加上了标签。因此训练样本集必须由带标签的样本组成。例子:鸢尾花数据集

鸢尾花数据集:其中一类与另两类线性可分, 而另两类直接不线性可分。
iris = datasets.load_iris()# 导入数据和标签iris_X = iris.data # 属性iris_y = iris.target # 对应类别
X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size=0.2,random_state=0xAAAA) # 测试比例 ,随机种子
# 设置knn分类器knn = KNeighborsClassifier()
# 进行训练knn.fit(X_train, y_train)
print(y_test) # 真实值print(knn.predict(X_test)) # 预测值print(knn.score(X_test,y_test))
