监督学习/Supervised learning
监督学习的目标是从已知训练数据中学习一个预测模型,使得这个模型对于其他输入数据产生一个预测输出。其中,监督学习的「监督」是相对与「非监督」的一种表达,二者的区别在于,监督学习的训练数据经过了人工进行标注,而非监督学习则没有这个过程。
类型
分类
已有了一些数据样本及明确的样本分类。现在从这些样本的特征中总结规律,再用于判断新输入样本到底属于哪一类别。
回归
Jupyter Notebook安装
安装: https://jupyter.org/install.html
数据
鸢尾花
概念
| 概念 | |
|---|---|
| 数据集 | 数据整体叫数据集 |
| 样本 | 每一行数据成为一个样本 |
| 特征 | 每一列表达样本的一个特征 |
| 标签 | 每道题附带的标准答案,最后一列成为标记 |
机器学习输入的是数据以及标签,输出的是学会的知识。 每一道习题,叫做数据样本。所有题目的集合,就是数据集。每道题附带的标准答案,称之为数据的标签。人学习和机器学习的对标如下:
人学习:人通过做习题,并利用习题答案校验,学会知识。
机器学习:机器通过挖掘数据,并利用数据标签校验,学会知识。
