有监督和无监督的区别

  1. 有监督学习方法必须要有训练集与测试样本。在训练集中找规律,而对测试样本使用这种规律。而非监督学习没有训练集,只有一组数据,在该组数据集内寻找规律。
    2. 有监督学习的方法就是识别事物,识别的结果表现在给待识别数据加上了标签。因此训练样本集必须由带标签的样本组成。

    例子:鸢尾花数据集

    image.png
    鸢尾花数据集:其中一类与另两类线性可分, 而另两类直接不线性可分。
    image.png
    1. iris = datasets.load_iris()
    2. # 导入数据和标签
    3. iris_X = iris.data # 属性
    4. iris_y = iris.target # 对应类别
    1. X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size=0.2,random_state=0xAAAA) # 测试比例 ,随机种子
    1. # 设置knn分类器
    2. knn = KNeighborsClassifier()
    1. # 进行训练
    2. knn.fit(X_train, y_train)
    1. print(y_test) # 真实值
    2. print(knn.predict(X_test)) # 预测值
    3. print(knn.score(X_test,y_test))