- 定义
- 数据
- 自动分析获得模型
- 预测
- 从数据中自动分析获得模型,并利用模型对未知数据进行预测
- 工作流程
- 获取数据
- 数据基本处理
- 特征工程
- 机器学习(模型训练)
- 模型评估
- 获取到的数据集介绍
- 专有名词
- 样本(一行数据)
- 特征(一列数据)
- 目标值(标签值)
- 特征值
- 数据类型构成
- 类型一:特征值+目标值
- 目标值分为离散还是连续
- 类型二:只有特征值,没有目标值
- 类型一:特征值+目标值
- 数据划分
- 训练数据(训练集) —构建模型
- 0.7—0.8
- 测试数据(测试集) —模型评估
- 0.2—0.3
- 训练数据(训练集) —构建模型
- 专有名词
- 数据基本处理
- 对数进行缺失值、去除异常值等处理
- 特征工程
- 定义
- 把数九转换成为机器更容易识别的数据
- 为什么需要特征工程
- 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
- 包含内容
- 特征提取
- 特征预处理
- 特征降维
- 定义
- 机器学习
- 选择合适的算法对模型进行训练
- 模型评估
- 对训练好的模型进行评价
