一、简要介绍 - 监督学习与无监督学习 - 《机器学习》

机器学习如果按照训练样本标签的有无可以分为以下两种常用方法。有监督学习(supervised learning)和无监督学习(unsupervised learning)。
监督学习，就是通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。
无监督学习是一种机器学习的训练方式，在没有标签的数据里可以发现潜在的一些结构的一种训练方式。无监督学习没有明确的目的、无监督学习不需要给数据打标签、无监督学习无法量化效果
监督学习方法必须要有训练集与测试样本。在训练集中找规律，而对测试样本使用这种规律。而非监督学习没有训练集，只有一组数据，在该组数据集内寻找规律。
监督学习的方法就是识别事物，识别的结果表现在给待识别数据加上了标签。因此训练样本集必须由带标签的样本组成。而无监督学习方法只有要分析的数据集的本身，预先没有什么标签。如果发现数据集呈现某种聚集性，则可按自然的聚集性分类，但不予以某种预先分类标签对上号为目的。