1. 定义
      1. 数据
      2. 自动分析获得模型
      3. 预测
      4. 从数据中自动分析获得模型,并利用模型对未知数据进行预测
    2. 工作流程
      1. 获取数据
      2. 数据基本处理
      3. 特征工程
      4. 机器学习(模型训练)
      5. 模型评估
    3. 获取到的数据集介绍
      1. 专有名词
        1. 样本(一行数据)
        2. 特征(一列数据)
        3. 目标值(标签值)
        4. 特征值
      2. 数据类型构成
        1. 类型一:特征值+目标值
          1. 目标值分为离散还是连续
        2. 类型二:只有特征值,没有目标值
      3. 数据划分
        1. 训练数据(训练集) —构建模型
          1. 0.7—0.8
        2. 测试数据(测试集) —模型评估
          1. 0.2—0.3
    4. 数据基本处理
      1. 对数进行缺失值、去除异常值等处理
    5. 特征工程
      1. 定义
        1. 把数九转换成为机器更容易识别的数据
      2. 为什么需要特征工程
        1. 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
      3. 包含内容
        1. 特征提取
        2. 特征预处理
        3. 特征降维
    6. 机器学习
      1. 选择合适的算法对模型进行训练
    7. 模型评估
      1. 对训练好的模型进行评价