数据集

记录:关于一个事件或者对象的描述
数据集:记录的集合

学习/训练

从数据中学得模型的过程
训练数据:训练使用的数据
训练集:训练样本的集合

预测

样例:拥有标记信息的示例
输出空间/标记空间:所有标记的集合

任务

分类:预测的是离散值
回归:预测的是连续值
聚类:将训练集分成若干组,每一组称作簇

测试

学得模型使用其进行预测

有监督和无监督

训练数据是否拥有标记信息

泛化

机器学习的目标是学得的模型能很好地适用于新样本。
泛化:学得模型适用于新样本的能力。
适用:对未知数据的预测能力。
机器学习最核心的目标之一,是与优化的根本区别,