机器学习在当前生活中广泛存在:搜索引擎,反垃圾邮件等
实际上,机器学习是AI发展出来的一个领域,是为计算机开发的一项新功能,如今涉及工业和基础科学中的许多领域
机器学习如此普遍的原因之一,就是网络和自动化技术的发展,这意味着我们拥有了前所未有的大量的数据集。
现在许多..试图采用机器学习算法来挖掘数据,更好地理解用户,并更好地为用户服务
机器学习的定义:
Arthur Samuel : 在没有明确设置的情况下,使计算机具有学习能力的研究领域
Tom Mitchell : 计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高
监督学习:我们给算法一个数据集,其中包含了正确的答案
回归问题:我们想要预测连续的数值输出(回归:我们设法预测连续值的属性)
分类问题:(分类:我们设法预测一个离散值输出 )
无监督学习:一种学习机制,给算法大量的数据,要求找出数据的类型结构
m:训练样本的数量
x:输入变量/特征
y:输出变量
( x , y ):训练样本
假设函数:
(弄清楚如何把最有可能的直线与我们的数据相拟合)
代价函数:
在线性回归中,我们要解决的是一个最小化问题
也就是预测值和实际值的差的平方误差和
梯度下降:
符号 := 表示赋值(==),这是一个赋值运算符
α-> 学习率 -> α用来控制梯度下降时,我们迈出多大的步子
同步更新:全部,先赋值temp,再赋值θ
矩阵和向量
向量是特殊的矩阵 是只有一列的矩阵 (m x 1)
不存在逆矩阵的矩阵被称为“奇异矩阵”或“退化矩阵”
