知道机器学习的开发流程
纪要
1.1 人工智能概述
1.人工智能起源
图灵测试<br /> 达特茅斯会议
2.人工智能三个阶段
1980年代是正式成形期<br /> 1990-2010年代是蓬勃发展期<br /> 2012年之后是深度学习期
3.人工智能、机器学习和深度学习
机器学习是人工智能的一个实现途径<br /> 深度学习是机器学习的一个方法发展而来
4.主要分支介绍
1.计算机视觉<br /> eg:人脸识别<br /> 2.自然语言处理<br /> 语音识别<br /> 语义识别<br /> 3.机器人
5.人工智能必备三要素【*】
数据<br /> 算法<br /> 计算力
6.gpu,cpu【**】
gpu -- 计算密集型<br /> cpu -- IO密集型
1.2.机器学习工作流程
1.定义【*】
数据<br /> 自动分析获得模型<br /> 预测<br /> 从数据中自动分析获得模型,并利用模型对未知数据进行预测
2.工作流程【**】
1.获取数据<br /> 2.数据基本处理<br /> 3.特征工程<br /> 4.机器学习(模型训练)<br /> 5.模型评估
3.获取到的数据集介绍【*】
1.专有名词<br /> 样本<br /> 特征<br /> 目标值(标签值)<br /> 特征值<br /> 2.数据类型构成<br /> 类型一:特征值+目标值<br /> 目标值分为是离散还是连续<br /> 类型二: 只有特征值,没有目标值<br /> 3.数据划分<br /> 训练数据(训练集) -- 构建模型<br /> 0.7--0.8<br /> 测试数据(测试集) -- 模型评估<br /> 0.2--0.3
4.数据基本处理
对数进行缺失值、去除异常值等处理
5.特征工程
1.定义<br /> 把数据转换成为机器更容易识别的数据<br /> 2.为什么需要特征工程<br /> 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已<br /> 3.包含内容<br /> 特征提取<br /> 特征预处理<br /> 特征降维
6.机器学习
选择合适的算法对模型进行训练
7.模型评估
对训练好的模型进行评估
1.3 机器学习算法分类【*】
1.监督学习 — 有特征值,有目标值
目标值连续-- 回归<br /> 目标值离散-- 分类
2.无监督学习 — 仅有特征值
3.半监督学习
有特征值,但是一部分数据有目标值,一部分没有
4.强化学习
动态过程,上一步数据的输出是下一步数据的输入<br /> 四要素:agent, action, environment,Reward,
1.4 模型评估
1.分类模型评估
准确率<br /> 精确率<br /> 召回率<br /> F1-score<br /> AUC指标
2 回归模型评估
均方根误差<br /> 相对平方误差<br /> 平均绝对误差<br /> 相对绝对误差<br /> 决定系数
3.拟合
欠拟合<br /> 过拟合