什么是机器学习?

李宏毅定义
机器学习:让机器具备找函式的能力。这个函式一般很复杂,无法直接写出来,所以借助机器的力量,把这个函式找出来。

机器学习两大类任务: regression 和 classification
现在还有Structured learning这个任务

找函式的3个步骤:
1.先写一个猜测的函数 - 也可以叫模型(即带有未知参数的函数)
2.计算 lOSS
3.最优化解

1.什么是机器学习
通过已往的经验也就是过去的一些历史数据,让机器具备找函数的能力,这个函数往往很复杂,无法直接写出来,但是可以借助机器的力量把这个函数找出来,有了这个函数以后,就可以解决和预测一些事情。
2.机器学习的例子
1.搜索引擎给网页排序
2.新闻的自动分类
3.垃圾邮件过滤垃圾邮件
4.相片的分类功能
3.机器学习算法的分类
监督学习和非监督学习
4.什么是监督学习和非监督学习
监督学习就是我们教会计算机做某件事情,其实就是数据集里的每个数据都有一个“正确的答案”,再根据这些样本做预测。比如我们拿到一堆是肿瘤和不是肿瘤的数据。
非监督学习 **就是让计算机自己学习,数据要么都没有标签要么就是相同的标签,事先并不知道数据里有什么

机器学习的步骤?
1.先写一个猜测的函数-也就是模型
2.计算损失函数Loss
3.找最优化解

什么是梯度下降
梯度下降是一个用来求函数最小值的算法,我们将使用梯度下降算法来求出损失函数 机器学习问题 - 图1 的最小值。

有哪些方法可以求损失函数的最小值
梯度下降和正规方程

分类算法有哪些?
逻辑回归算法,逻辑回归算法:对于给定的输入变量,根据选择的参数计算出输出变量等于1的概率。

有哪些办法可以优化损失函数?
共轭梯度法

什么是过拟合?**
我们有很多的特征,通过学习得到的假设函数能很好的适应训练集,但是对于给的新数据,效果就很差

有哪些方法可以解决过拟合?
1.丢弃一些不能帮助我们正确预测的特征
2.正则化:保留所有特征,但是减少参数的大小

什么是神经网络
神经网路有很多简单的单元组并行互联组成,这些单元组具有适应性,神经网络的这种组织架构能够模拟生物的神经系统对真实世界物体做出的交互反应。

神经网络和多项式拟合的区别
神经网络相比与多项式的拟合,其优势在于是在构建一个”有效表示“,也就是会表达式里的特征是与问题更相关的特征,而不是像包含了所有项的多项式。
神经网络并不期望一个明确的表达式,而是拟合一个概率模型,即对于一个输入,我们期望能够最大程度地输出一个和实际情况相符的概率分布。