数据集学习/训练预测任务测试有监督和无监督泛化 数据集记录:关于一个事件或者对象的描述数据集:记录的集合 学习/训练从数据中学得模型的过程训练数据:训练使用的数据训练集:训练样本的集合 预测样例:拥有标记信息的示例输出空间/标记空间:所有标记的集合 任务分类:预测的是离散值回归:预测的是连续值聚类:将训练集分成若干组,每一组称作簇 测试学得模型使用其进行预测 有监督和无监督训练数据是否拥有标记信息 泛化机器学习的目标是学得的模型能很好地适用于新样本。泛化:学得模型适用于新样本的能力。适用:对未知数据的预测能力。机器学习最核心的目标之一,是与优化的根本区别,